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Vorwort 


Die Computergraphik beschäftigt sich mit der Erzeugung und Manipulation von 
Bildern durch einen Computer. Die erzeugten Darstellungen sind meistens Ab- 
bilder von nicht in der Realität existierenden Objekten, die mit mathematischen 
Verfahren definiert sind. Ein wesentliches Ziel dabei ist es, den dargestellten 
Objekten ein möglichst realistisches Aussehen zu verleihen, so daß sie von real 
existierenden Objekten nicht zu unterscheiden sind. Dadurch wird ein Durch- 
mischen und Überblenden von real existierenden und synthetisch definierten 
Objekten ermöglicht, die Grenzen zwischen Realität und Illusion verschwim- 
men. Dies wird insbesondere von der Film- und Werbeindustrie ausgenutzt, 
um beim Zuschauer je nach Situation Interesse, Neugier, Verwunderung oder 
Verblüffung hervorzurufen. 


Neben diesem vielleicht als Spielerei und unwissenschaftlich zu bezeichnenden 
Einsatzgebiet haben die Verfahren der Computergraphik mittlerweile Einzug 
in viele Bereiche des täglichen Lebens genommen. Dabei sind Anwendungen 
in der Medizin zu nennen, wo z.B. bei der Computertomographie mit Hilfe 
der Computergraphik ein dreidimensionales Modell eines nicht sichtbaren Be- 
reiches des menschlichen Körpers gewonnen wird. Weitere Anwendungsgebiete 
sind der weite Bereich der CAD (computer aided design), der im Maschinenbau 
und der Fahrzeugindustrie eine große Rolle spielt, und der Bereich der Archi- 
tektur, wo mit Hilfe des Computers ein Modell des zu erstellenden Gebäudes 
erzeugt werden kann. Mit Raumplanungswerkzeugen kann ein genaues Modell 
der Innenräume des Gebäudes entworfen werden, an dem besser als mit jedem 
anderen Modell aus Pappe oder Holz die Licht- und Klimaverhältnisse vor Fer- 
tigstellung des Gebäudes genau analysiert und gegebenenfalls verändert werden 
können. Für geplante Konzert- oder Vortragsräume können die akustischen 
Verhältnisse bestimmt und die räumlichen Gegebenheiten können so lange an- 
gepaßt werden, bis eine optimale Akustik garantiert ist. Weitere Anwendungs- 
gebiete sind die Flugsimulation, Visualisierungs- und Simulationsverfahren für 
physikalische Vorgänge und Videospiele. 


Das vorliegende Buch beschreibt die grundlegenden Verfahren und Algorithmen 
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der Computergraphik, wobei der Schwerpunkt auf der Erzeugung von Bildern 
mit möglichst realistischem Aussehen liegt. Spezielle Hardware-Komponenten 
für den Einsatz in der Computergraphik und die Architektur von Graphikpro- 
zessoren werden nicht behandelt. Ziel des Buches ist es, dem Leser ein Verständ- 
nis der grundlegenden Verfahren zu vermitteln und ihn in die Lage zu versetzen, 
diese zu implementieren. Letzterem Ziel dienen viele Programmskizzen, die die 
ım Text beschriebenen Algorithmen unter einem implementierungstechnischen 
Aspekt zusammenfassen. Die Programmskizzen erheben nicht den Anspruch, 
eine zeitoptimale Implementierung wiederzugeben. Vielmehr wird aus didak- 
tischen Gründen die Darstellung im Text aufgegriffen, damit ein direkter Zu- 
sammenhang erkennbar ist. Kleinere Optimierungen wie die Zusammenfassung 
konstanter Ausdrücke und das Herausziehen invarianter Ausdrücke aus Schlei- 
fen können in vielen Fällen das Zeitverhalten der wiedergegebenen Programme 
verbessern. Viele dieser Optimierungen werden aber ohnehin bei Anwendung 
eines optimierenden Compilers durchgeführt. 


Das vorliegende Buch ist aus einer Vorlesung entstanden, die ich im Winterse- 
mester 90/91 an der Universität Saarbrücken gehalten hat. Obwohl viele Teile 
aktulisiert und erweitert wurden, spiegelt die Anordnung des Stoffes die dama- 
lige Gliederung im wesentlichen wieder. An der Erstellung des die Vorlesung 
begleitenden Skriptes waren viele Studenten beteiligt, denen hiermit für ihre 
Mühe gedankt sei. Herrn Professor Paul und Herrn Professor Hotz danke ich 
für die Anregung und Unterstützung des Planes zur Erstellung dieses Buches. 
Für viele fruchtbare Diskussionen danke ich neben vielen anderen insbesondere 
Arno Formella. Für das unerläßliche Korrekturlesen danke ich unter ande- 
rem Marc Bamberger, Jürgen Feiler, Arno Formella, Christian Gill, Andreas 
Kronz, Wolfgang Paul, Dietmar Schmidt und Thomas Walle. Dem Teubner- 
Verlag, insbesondere Herrn Professor Appelrath als betreuenden Herausgeber 
und Herrn Spuhler, danke ich für die angenehme Zusammenarbeit. 


Saarbrücken, im Mai 1993 


Thomas Rauber 


für meine Eltern 
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Kapitel 1 
Einleitung 


Die Computergraphik hat in den letzten Jahren einen stürmischen Aufschwung 
erlebt und ist heute in vielen Bereichen von Industrie und Technik unentbehrlich 
geworden. Getragen wird diese Entwicklung u.a. durch die großen Fortschritte 
beim Bau von Rechnern, die immer leistungsfähigere Rechner zu immer günsti- 
geren Preisen verfügbar machen. Dadurch werden die teilweise sehr rechenzeit- 
aufwendigen Verfahren der Computergraphik auch für den Einsatz in einfachen 
Workstations und PCs interessant. 


Als Ausgabemedien für die erzeugten Darstellungen unterscheidet man zwischen 
Vektorgraphiksystemen und Rastergraphiksystemen. Viele der in diesem Buch 
behandelten Algorithmen sind ausschließlich für Rastergraphiksysteme anwend- 
bar. Wir werden in diesem einleitenden Abschnitt kurz auf die Unterscheidung 
eingehen und die Beschränkung unserer Aufmerksamkeit auf Rastergraphiksy- 
steme begründen. 


1.1 Vektorgraphiksysteme 


Vektorgraphiksysteme und Rastergraphiksysteme sind Systeme zur graphischen 
Ausgabe von Daten, die als Peripheriegeräte an die CPU (central processing 
unit) angeschlossen sind. Vektor steht als Synonym für Linie und drückt die 
Tatsache aus, daß Vektorgraphiksysteme nur Linien (und Punkte als dege- 
nerierte Linien) darstellen können. Ein typisches Vektorgraphiksystem be- 
steht aus einem Displayprozessor, der von der CPU gesteuert wird, einem 
Display-Pufferspeicher und einem Bildschirm, vgl. Abbildung 1.1, siehe auch 
[FvDFH90]. Der Display-Pufferspeicher dient zur Ablage des Displaypro- 
gramms, das Befehle zur Darstellung von Punkten, Linien und Buchstaben 
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Abbildung 1.1: Aufbau eines Vektorgraphiksystems. 


enthält und das von der CPU verändert werden kann. Der letzte Befehl des 
Displayprogramms ist immer ein unbedingter Sprung zum ersten Befehl, damit 
das Displayprogramm zyklisch durchlaufen wird. Der Displayprozessor interpre- 
tiert die Befehle des Displayprogramms und sorgt für die Darstellung auf dem 
Bildschirm. Dabei wandelt er die im Displayprogramm digital dargestellten 
Koordinatenwerte in analoge Spannungswerte um, mit denen die Ablenkungs- 
einheiten des Bildschirms gesteuert werden. Die Befehle zur Darstellung von 
Buchstaben werden bei der Interpretation in Befehle zur Darstellung von Linien 
und Punkten zerlegt. Eine Linie wird auf dem Bildschirm dargestellt, indem 
der Elektronenstrahl des Bildschirms auf den Anfangspunkt der Linie gerichtet 
wird. Dort wird er angestellt und auf einer geraden Linie bis zum Endpunkt 
der Linie gelenkt, wo er wieder abgestellt wird. Da die Steuerung zwischen den 
beiden Endpunkten der Linie durch analoge Spannungswerte erfolgt, wird eine 
exakte Linie auf den Bildschirm dargestellt. 


Die üblicherweise verwendeten Bildschirme sind mit Phosphor beschichtete Ka- 
thodenstrahlröhren. Wenn der Elektronenstrahl der Bildröhre auf die Phos- 
phorschicht trifft, leuchtet die entsprechende Stelle des Bildschirms je nach Art 
des verwendeten Phosphors einige zehn bis einige hundert Mikrosekunden auf!. 


!Für die üblicherweise verwendeten Phosphorarten liegt der Wert etwa zwischen 10 und 
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Um ein für das menschliche Auge wahrnehmbares Flackern des Bildschirms 
zu vermeiden, muß die Phosphorschicht mindestens 50 Mal pro Sekunde aufge- 
frischt werden, d.h. der Displayprozessor muß das Displayprogramm mindestens 
50 Mal pro Sekunde durchlaufen und interpretieren. Die Zeit für das Interpre- 
tieren des Displayprogramms ist abhängig von dessen Länge. Für komplexe 
Bilddarstellungen mit großem Displayprogramm kann es daher vorkommen, 
daß der Displayprozessor zur Interpretation des Displayprogramms mehr als 
die zur Verfügung stehenden 1/50 sec braucht. In diesem Fall ist ein Flackern 
des Bildschirms wahrzunehmen. 


Der Vorteil eines Vektorgraphiksystems liegt darin, daß durch die analoge An- 
steuerung des Bildschirms prinzipiell jeder Punkt des Bildschirms erreicht wer- 
den kann. Dies führt zu einer hohen Auflösung und einer exakten Wiedergabe 
der darzustellenden Linien. Außerdem erfordert eine geringfügige Änderung 
der Bildschirmdarstellung auch nur eine geringfügige Änderung des Display- 
programms. Der Nachteil eines Vektorgraphiksystems besteht darin, daß nur 
Linien und einzelne Punkte auf dem Bildschirm dargestellt werden können. 
Ausgefüllte Flächen können zwar prinzipiell dadurch dargestellt werden, daß 
sie durch viele, dicht nebeneinander verlaufende Linien ausgefüllt werden. Da 
aber alle diese Linien einzeln im Displayprogramm angegeben werden müssen, 
wird dieses sehr schnell sehr groß mit dem oben erwähnten Effekt, daß der 
Bildschirm flackert. Daher ist eigentlich nur die Wiedergabe von Drahtgitter- 
modellen möglich. Außerdem sind Vektorgraphiksysteme recht teuer. 


1.2 Rastergraphiksysteme 


Ein Rastergraphiksystem hat prinzipiell einen ähnlichen Aufbau wie ein Vek- 
torgraphiksystem, vgl. Abbildung 1.2. Die verschiedenen Komponenten werden 
aber zum Teil anders genutzt. Der grundlegende Unterschied zu einem Vek- 
torgraphiksystem besteht darin, daß der Bildschirm in ein festes Raster von 
Bildpunkten aufgeteilt ist, die als Pixel (für picture element) bezeichnet wer- 
den. Der Display-Pufferspeicher ist ebenfalls als Raster organisiert, in dem für 
jedes Bildschirmpixel der darzustellende Intensitätswert abgespeichert ist. Die 
Anzahl der Zeilen und Spalten des Rasters bestimmt die Auflösung des Raster- 
graphiksystems. Ein System der Auflösung 1280 x 1024 verwendet ein Raster 
mit 1024 Zeilen und 1280 Spalten. Die Anzahl der auf dem Bildschirm darstell- 


baren Intensitätswerte hängt davon ab, wieviele Bits für das Abspeichern des 


60 Mikrosekunden. Die Verwendung von länger leuchtendem Phosphor hat den Vorteil, daß 
der Bildschirm nicht so oft aufgefrischt werden muß, und den Nachteil, daß der Bildschirm 
nachleuchtet. Dies ist vor allem für die Darstellung von bewegten Bildern störend. 
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Intensitätswertes eines Pixels im Pufferspeicher zur Verfügung stehen. Für ein- 
fache Systeme steht manchmal nur ein Bit pro Pixel zur Verfügung, es können 
also nur zwei verschiedene Intensitätswerte auf dem Bildschirm dargestellt wer- 
den. Für aufwendigere Systeme stehen oft 24 Bit zur Verfügung. Damit können 
2°, also etwa 16 Millionen unterschiedliche Intensitätswerte dargestellt werden. 
Für Farbsysteme werden die 24 Bits in drei Komponenten aufgeteilt. Jede Kom- 
ponente dient zur Steuerung eines der in Farbbildschirmen für die drei Grund- 
farben rot, grün und blau verwendeten drei unabhängigen Elektronenstrahlen. 
Die Umwandlung der darzustellenden Objekte in Pixelwerte und deren Ablage 
im Pufferspeicher besorgt der Displayprozessor. Dieser ist in einfachen Sy- 
stemen wie z.B. PC’s meist als Softwarekomponente einer Graphik-Bibliothek 
realisiert, in aufwendigeren Grafik-Workstations existiert der Displayprozessor 
dagegen oft als Hardwarekomponente. Der Video-Controller stellt den Inhalt 
des Pufferspeichers auf dem Bildschirm dar. Dazu durchläuft er den Pufferspei- 
cher von oben nach unten zeilenweise und steuert für jedes Pixel des Bildschirms 
den Elektronenstrahl entsprechend der darzustellenden Intensität. Abbildung 
1.3 zeigt den schematisierten Aufbau eines Video-Controllers. Um ein Flackern 
des Bildschirms zu vermeiden, muß der Video-Controller den Inhalt des Puffer- 
speichers etwa 50 Mal pro Sekunde auf dem Bildschirm darstellen. Ein in einem 
Rastergraphiksystem verwendeter Video-Controller ist natürlich so ausgelegt, 
daß er dies bei der gegebenen Bildschirmauflösung kann. Der für Vektorgra- 
phiksysteme geschilderte Fall, daß bei komplexen Bildschirmdarstellungen ein 
Flackern auftritt, kann also nicht eintreten. Auf der anderen Seite beeinflußt 
diese Forderung aber die erreichbare Auflösung des Bildschirms: Ein gegebener 
Video-Controller ist nur in der Lage, bis zu einer gewissen Bildschirmauflösung 
flackerfreie Darstellungen zu liefern. Die mit heutiger Technologie hergestellten 
Video-Oontroller liefern typischerweise Auflösungen zwischen 640 x 480 und 
1600 x 1200. Höhere Auflösungen erfordern eine kurze Zugriffszeit auf den 
Pufferspeicher und einen geeigneten Bildschirm. 


Der Hauptvorteil von Rastergraphiksystemen liegt darin, daß sie im Vergleich zu 
Vektorgraphiksystemen relativ billig herzustellen sind?, und daß sie zur Darstel- 
lung von ausgefüllten Flächen in der Lage sind. Die Nachteile von Rastergra- 
phiksystemen liegen in einer niedrigeren Auflösung als Vektorgraphiksysteme 
und in der Tatsache, daß Aliasing-Effekte auftreten können, die aufgrund der 
Diskretisierung des Bildschirms entstehen. Ein typischer Aliasing-Effekt ist 
z.B. der Treppenstufeneffekt bei der Darstellung von geneigten Linien, vgl. Ab- 
bildung 2.1. Diese Effekte können mit den in Abschnitt 2.7 beschriebenen Anti- 
Aliasing-Techniken zumindest teilweise behoben werden. Ein weiterer Nachteil 


?Dies liegt vor allem daran, daß auf die relativ weit entwickelte Fernsehtechnik zurückge- 
griffen werden kann. | 
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Abbildung 1.2: Aufbau eines Rastergraphiksystems. 
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Ablenkungseinheit 
des Bildschirms 


Intensität des 
Bildschirms 





Abbildung 1.3: Video-Controller eines Rastergraphiksystems: Der Pufferspeicher ist 
als zweidimensionales Feld organisiert und wird mit Hilfe zweier Adreßregister x und y 
angesprochen. x und y werden vom Raster-Scan-Generator kontrolliert. Dieser sorgt 
durch Steuerung der Ablenkungseinheiten des Bildschirms dafür, daß der Elektronenstrahl 
an die richtige Bildschirmposition gelenkt wird und durch Steuerung der Intensität des 
Elektronenstrahls dafür, daß der aus dem Pufferspeicher erhaltene Pixelwert dargestellt 
wird. 
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von Rastergraphiksystemen besteht darin, daß eine Echtzeitdarstellung sich be- 
wegender Objekte schwieriger zu erreichen ist als mit Vektorgraphiksystemen: 
Für Vektorgraphiksysteme brauchen nur die Endpunkte der Linien im Puffer- 
speicher geändert zu werden, die das sich bewegende Objekt darstellen. Für 
Rastergraphiksysteme müssen dagegen auch alle zu den Linien gehörenden Pi- 
xelwerte geändert werden. Trotz dieser Nachteile haben Rastergraphiksysteme 
Vektorgraphiksysteme vor allem wegen ihrer geringeren Kosten fast vollständig 
vom Markt verdrängt. Vektorgraphiksysteme werden heute nur noch für sehr 
spezielle Anwendungen verwendet, die eine sehr hohe Bildschirmauflösung erfor- 
dern. Wegen der schwindenden Verbreitung von Vektorgraphiksystemen werden 
wir im folgenden davon ausgehen, daß ein Rastergraphiksystem verwendet wird. 
Wir werden hier nicht weiter auf die Hardwarekomponenten von Graphiksyste- 
men eingehen. Eine ausführliche Behandlung der Architektur moderner Gra- 


phiksysteme findet der Leser z.B. in [FvDFH90] oder [RL88]. 


1.3 Überblick 


Kapitel 2 des vorliegenden Buches beschreibt grundlegende zweidimensionale 
Algorithmen wie die Darstellung von Linien und Ellipsen, das Füllen und Clip- 
pen von Polygonen, die Anwendung von Halbtonverfahren zur Wiedergabe von 
Farbbildern, das Besetzen einer evtl. vorhandenen Farbtabelle und die Anwen- 
dung von Techniken zur Behebung von Aliasing-Effekten. Kapitel 3 legt die 
mathematischen Grundlagen zur Beschreibung der dreidimensionalen Compu- 
tergraphik. Kapitel 4 stellt die gängigen Algorithmen zur Bestimmung sicht- 
barer Oberflächen vor. Kapitel 5 führt Reflexions- und Beleuchtungsmodelle 
ein, mit denen die Oberflächeneigenschaften der dargestellten Objektes und 
die Abstrahlungseigenschaften der Lichtquellen nachgebildet werden. Kapitel 
6 beschreibt Schattierungsverfahren, die den Aufwand bei der Darstellung von 
Objekten reduzieren helfen. Kapitel 7 beschäftigt sich mit der Darstellung 
und mathematischen Beschreibung von gekrümmten Oberflächen. Die Ka- 
pitel 8 und 9 beschreiben globale Darstellungsverfahren (Ray-Tracing- undd 
Radiosity-Verfahren), die für die Wiedergabe eines Objektes alle anderen Ob- 
jekte berücksichtigen, die das Aussehen des Objektes durch Schattenwurf oder 
Reflexionen beeinflussen. Kapitel 10 beschreibt Verfahren zur Erzeugung von 
Schatten und Oberflächenstrukturen, mit deren Hilfe die Realitätstreue der dar- 
gestellten Objekte weiter erhöht werden kann. 


Kapitel 2 


Grundlegende 
Rastergraphikalgorithmen 


Wir werden in diesem Kapitel einige grundlegende Algorithmen für Rastergra- 
phiksysteme beschreiben. Dazu gehören Algorithmen zur Darstellung von Li- 
nien und allgemeinen Kurven zweiter Ordnung, Anti-Aliasing-Methoden, Algo- 
rithmen zum Füllen und zum Clippen von Polygonen, ebenso wie Algorithmen 
zur Auswahl und Erweiterung der für die Bildschirmdarstellung zur Verfügung 
stehenden Farbpalette. Einige der in diesem Kapitel besprochenen Algorith- 
men sind für moderne Graphik-Workstations in Hardware implementiert und 
der Programmierer braucht sich eigentlich nicht um die zugrundeliegenden Al- 
gorithmen zu kümmern. Trotzdem ist es wichtig, diese Grundalgorithmen zu 
kennen: für weniger weit entwickelte Systeme müssen sie in Software imple- 
mentiert werden, für Systeme mit entsprechenden Hardware-Komponenten ist 
die Kenntnis der Grundalgorithmen Voraussetzung für das Verständnis dafür, 
welche Teile eines Programmes wegen Hardwareunterstützung wenig Rechenzeit 
beanspruchen und welche Teile mehr Rechenzeit erfordern. Außerdem bauen 
viele weiterführende Algorithmen auf den Grundalgorithmen auf. 


2.1 Darstellung von Linien 


Ziel jedes Algorithmus zur Bildschirmdarstellung von Linien ist es, die Pixel 
so zu setzen, daß sie dem idealen Linienverlauf möglichst nahe kommen. Wir 
nehmen im folgenden an, daß die Linien mit einer Dicke von einem Pixel darge- 
stellt werden sollen. Für Geraden mit Steigung zwischen -1 und 1 einschließlich 
bedeutet dies, daß in jeder Spalte genau ein Pixel gesetzt wird. Für Gera- 
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+ + tr r + 3 + + + + + + + #3 + + + + + + + 
Bildschirm-Pixel 
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(Zn Yn) 





(z1,Yı) 


Abbildung 2.1: Linie zwischen den Pixeln (zı,y1) und (2„,Yn). Die gesetzten Pixel sind 
als quadratische Boxen dargestellt, deren Eckpunkte mit den Punkten eines regelmäßigen 
Gitters zusammenfallen. Für nicht gesetzte Pixel sind die Boxen nur angedeutet. 


den mit anderen Steigungen wird genau ein Pixel pro Zeile gesetzt. Wir wer- 
den in diesem Abschnitt schrittweise den sogenannten Bresenham-Algorithmus, 
vgl. [Bre65] und [FvDFH90], einen effizienten Algorithmus zur Darstellung von 
Linien, entwickeln. Eine ähnliche Ableitung findet man in [Spr82] und [BG89]. 


2.1.1 Inkrementeller Algorithmus 


Wir nehmen im folgenden an, daß (zı,yı) und (2„,4n) die beiden Endpunkte 
der darzustellenden Linie sind. Dabei legen wir ein rechtwinkliges Koordinaten- 
system zugrunde, dessen Ursprung in der linken unteren Ecke des Bildschirms 
liegt. Außerdem nehmen wir an, daß die Steigung der darzustellenden Linie 
zwischen 0 und 1 liegt. Linien mit anderen Steigungen werden wir später als 
Symmetriefälle behandeln. Die Linie zwischen (ug) und (z„,4n) ist Teil einer 
Geraden mit der Gleichung! 


_ A 
y-mi+b mt m- HM. 
£Zn-Lı Ar 


Die einfachste Methode für die Darstellung der Linie besteht darin, für alle 
ganzzahligen <-Werte x; zwischen zı und z, den Wert y; = mx;+b zu berechnen 
und die Pixel (x;,round(y;)) zu setzen, wobei round(y) den Floating-Point-Wert 
y zur nächstliegenden Integerzahl rundet. Dadurch werden alle Pixel gesetzt, 
die der idealen Linie am nächsten liegen. Der Nachteil dieser Methode besteht 


Der Wert von b spielt im folgenden keine Rolle. 
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void line (xi,yi,xn,yn,value) 
int xi,yi,xn,yn,value; 


Abbildung 2.2: Inkrementeller Al- 


float m,y; gorithmus zur Darstellung von Li- 


int x; nien. (x1,y1) und (xn,yn) sind die 
m = ((float)(yn-yi))/(xn-x1); Endpunkte der darzustellenden Linie, 
y=y1; value gibt den Intensitätswert an, auf 


den die Pixel gesetzt werden sollen. 
set pixel(x,y,value) sei eine Bi- 
bliotheksfunktion, die Pixel (x,y) auf 
den Intensitätswert value setzt. 


for(x=x1; x<=xn; x++) { 
set_pixel(x,round(y),value); 
y-y+m; 


darin, daß zum Setzen jedes Pixels eine Floating-Point-Multiplikation und eine 
Rundungsoperation benötigt wird. Beides sind für Rechner ohne Floating- 
Point-Coprozessoren sehr rechenzeitaufwendige Operationen. Abhilfe schafft 
die Ausnutzung der Beobachtung, daß sich x in jedem Schritt um 1 ändert, 
d.h. es ist 2,4, = 2; +1. Damit gilt: 


y = mu+b 


Yırı ma +b=ms;+b+m=y+m 

d.h. y ändert sich in jedem Schritt um m. Damit kann man die für jedes 
Pixel erforderliche Floating-Point-Multiplikation durch eine Floating-Point- 
Addition ersetzen, die auf vielen Rechnern schneller durchgeführt werden kann. 
Dies führt zu folgendem Algorithmus: Man durchläuft die ganzzahligen z-Werte 
zwischen z;ı und z,„ und errechnet in jedem Schritt einen zu setzenden Punkt 
(x;,9:) aus dem Vorgängerpunkt (z;-1,y:-ı) durch 5 = z.ı +1 und y; = 
y;_ı +m. Dann setzt man das Pixel, das dem errechneten Punkt (z;,y;) am 
nächsten liegt, d.h. das Pixel (z;,round(y;)). Das beschriebene Verfahren ist ein 
inkrementeller Algorithmus, weil der im Schritt i errechnete Punkt aus dem im 
Schritt © — 1 errechneten berechnet wird. Abbildung 2.2 zeigt eine Prozedur, 
die das Verfahren implementiert. Die Prozedur verwendet für die Berechnung 
der y-Werte Floating-Point-Arithmetik und führt für jedes gesetzte Pixel eine 
Rundungsoperation aus. 


Die Rundungsoperation läßt sich durch Einführen einer Variablen error ver- 
meiden. Wenn (z,y) das zuletzt gesetzte Pixel ist, gibt error an, um wieviel 
das Pixel (x + 1,y) von der idealen Linie abweicht, vgl. Abbildung 2.3. error 
wird in jedem Schritt um m erhöht. Wenn error < 0.5 ist, liegt das Pixel 
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Abbildung 2.3: Einführung einer 
Variablen error zur Eliminierung der 
Rundungsoperatione Für die ein- 
gezeichnete Linie werden die Pixel 
(z,9), (@+1,9) und (e+2,y+1) 


gesetzt. 














void line (xi1,yi,xn,yn,value) 
int xi,yi,xn,yn,value; 

{ 

float m,error; 

int x,y; 


m = ((float) (yn-y1))/(xn-x1); 

y=yl; error=0.0; 

for(x=x1; x<=xn; x++) { 
set_pixel(x,y,value); 
error+=n; 
if (error>=0.5) { 

y++; error--; 


Abbildung 2.4 Eliminieren der 
Rundungsoperation durch Einführen 
der Variablen error. 


(x + 1,y) näher zur idealen Linie als das Pixel (e + 1,y-+ 1) und wird daher 
gesetzt. Wenn error > 0.5 ist, wird das Pixel (e+1,y-+ 1) gesetzt. In diesem 
Fall wird error zusätzlich um 1 dekrementiert. Die resultierende Prozedur in 
Abbildung 2.4 braucht zwar weiter Floating-Point-Werte zur Darstellung von m 
und error, kommt pro gesetztem Pixel aber mit einer Floating-Point-Addition 
und einem Floating-Point-Vergleich aus. 


2.1.2 Bresenham-Algorithmus 


Wir werden jetzt die Prozedur aus Abbildung 2.4 so verändern, daß keine 
Floating-Point-Arithmetik mehr benötigt wird. Der resultierende Algorith- 
mus ist als Bresenham-Algorithmus bekannt, vgl. [Bre65]. In der Prozedur aus 
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void line (x1,yi,xn,yn,value) 
int x1,yi,xn,yn,value; 


{ 





Abbildung 2.5: Bresenham-Algo- 
rithmus zur Darstellung von Linien. 
Zusätzlich zu den im Text beschrie- 
benen Änderungen ist die Variable 
error mit -dx/2 anstatt mit O initia- 
lisiert. Man beachte, daß die verwen- 
dete Division eine Integer-Division 
durch 2 ist, die durch einen ein- 
fachen Rechtsshift realisiert werden 
kann. Die Bedingung zur Auswahl 
der Pixel vereinfacht sich dadurch zu 
error >= 0. 





int error,x,y,dx,dy; 






dx=xn-x1; dy=yn-yl; 
error=-dx/2; y=y1; 
for(x=x1; x<=xn; x++) { 
set_pixel(x,y,value); 
error+t=dy; 
if(error>=0) { 
y+t+; error-=dx; 








Abbildung 2.4 wird die Variable m nur zur Berechnung von error verwendet. 
error wird nur zur Auswahl der zu setzenden Pixel benutzt. Der Wert von 
error geht nicht direkt in die Berechnung der zu setzenden Pixel ein. Eine 
Skalierung von m, error und der zugehörigen Auswahlbedingung für die Pixel 
hat daher keine Auswirkung darauf, welche Pixel gesetzt werden. Wenn wir mit 
dx = xn-x1 skalieren, nımmt m und damit auch error ausschließlich ganzzah- 
lige Werte an, für beide können also Integerwerte verwendet werden. Der für die 
Pixelauswahl verwendete Vergleich wird zu error >= dx/2. Weil error immer 
ganzzahlig ist, können wir dx/2 durch den Integerwert |dx/2]| ersetzen, ohne 
dadurch die Semantik zu ändern. Der Vergleich wird zu einem Vergleich zwi- 
schen Integerwerten. Damit sind alle Floating-Point-Operationen eliminiert, 
das Verfahren verwendet ausschließlich Integer-Arithmetik. Die resultierende 
Prozedur ist in Abbildung 2.5 wiedergegeben. 


Wie bereits erwähnt, arbeitet die Prozedur in Abbildung 2.5 nur für zı < x, 
und Steigungen zwischen 0 und 1, d.h. für Linien ım 1. Oktanden, vgl. Abbil- 
dung 2.6°. Wir werden jetzt beschreiben, wie man die Prozedur so erweitert, 
daß sie auch für alle anderen Oktanden verwendet werden kann. Für den ersten 
Oktanden werden die z-Werte zwischen z| und z, mit Schrittweite 1 durchlau- 
fen, die y-Werte der zu setzenden Pixel werden anhand der Abweichung von 
der idealen Linie bestimmt. Die treibende Achse ist also die £-Achse. In je- 


2Den Oktanden zu einer Linie bestimmt man, indem man den Endpunkt (zı,yı) in den 
Ursprung legt. Die Linie verläuft dann vollständig in einem der in Abbildung 2.6 wiederge- 
gebenen Oktanden. 
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treibende Achse 
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Abbildung 2.6: Behandlung der verschiedenen Oktanden. 


der Spalte wird genau ein Pixel gesetzt. Für den zweiten Oktanden wird die 
y-Achse als treibende Achse verwendet, in jeder Zeile wird genau ein Pixel ge- 
setzt. x und y vertauschen also ihre Rollen. Für eine Linie ım 8. Oktanden 
dient die r-Achse als treibende Achse, der Unterschied zum ersten Oktanden 
besteht darin, daß bei der Berechnung der y-Werte dekrementiert statt inkre- 
mentiert wird. Ähnliches gilt für den 2. und den 7. Oktanden. Die Oktanden 
3, 4, 5, 6 werden nach Vertauschen der Endpunkte wie die Oktanden 7, 8, 1, 2 
behandelt. Abbildung 2.7 zeigt die resultierende Prozedur. 


Ein Nachteil bei der Darstellung von Linien nach der beschriebenen Methode 
besteht darin, daß Linien unterschiedlicher Steigung unterschiedlich hell erschei- 
nen können, vgl. Abbildung 2.8, siehe auch [FvDFH90]. Dies kann durch Anpas- 
sung der Pixelintensität an die Steigung der Linie behoben werden. Eine andere 
Möglichkeit ist die Anwendung einer Anti-Aliasing-Technik, vgl. Abschnitt 2.7, 
mit der die Intensitätswerte der angrenzenden Pixel in die Darstellung mit ein- 
bezogen werden. 


2.2 Darstellung von Kurven zweiter Ordnung 


Wir werden uns in diesem Abschnitt mit der Darstellung von Kurven 2. Ordnung 
beschäftigen. Diese Kurven werden auch als Kegelschnitte bezeichnet, weil sie 
durch den Schnitt einer Ebene mit einem Kegel entstehen. Kreise, Ellipsen, 
Parabeln und Hyperbeln sind Beispiele für Kurven zweiter Ordnung. Allgemein 
wird eine Kurve 2. Ordnung durch eine Gleichung der Form 


ar? +2bzy+cy’ +2de +2ey+f=0 
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void Draw_Line (xi,yi,xn,yn,value) 
int xi1,yi,xn,yn,value; 
{ 
int error,x,y,dx,dy,xincr,yincr; 
dx = xn-xi1; dy = yn-yl; 
if (abs(dx) > abs(dy)) { 
if (dx<0) {swap(xn,x1); swap(yn,y1);} 
if (yn>yi) yincr = 1; 
else yincr = -1; 
‚error = -abs(dx)/2; 
for(x=x1,y=yl; x<=xn; x++){ 
set pixel(x,y,‚value); 
error += abs(dy); 
if (error>=0) {y+=yincr; error-=dx;} 
















} 


else { 
if (dy<0) {swap(xn,x1); swap(yn,y1);} 
if (xn>x1) xincr = 1; 
else xincr = -1; 
error = -abs(dy)/2; 
for (y=yil,x=x1; y=yn; y++){ 
set pixel(x,y,value); 
error+=abs(dx); 
if (error>=0) {x+=xincr; error-=dy;} 






Abbildung 2.7: Bresenham-Algorithmus mit Behandlung aller Fälle: Der Test abs (dx) 
> abs(dy) bestimmt, ob z oder y als treibende Achse verwendet wird. abs(x) sei eine 
Bibliotheksfunktion, die den Absolutbetrag der Integervariablen x bestimmt. Wenn der 
Test zutrifft, wird x als treibende Achse verwendet. Mit dem Test dx<O wird festgestellt, 
ob die beiden Endpunkte der Linie vertauscht werden müssen. Das Vertauschen der 
Werte zweier Integervariablen x und y wird durch die Prozedur swap(x,y) vorgenommen. 
Wenn z als treibende Achse verwendet wird, stellt der Test y2>y1 fest, ob y während der 
Berechnung inkrementiert oder dekrementiert wird. 
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Abbildung 2.8: Veranschaulichung der 
Intensitätsunterschiede bei der Darstellung 
von Linien unterschiedlicher Steigung: die 
diagonale Linie B hat Steigung 1 und ist 
„2 Mal länger als die horizontale Linie A. 
Weil jede der beiden Linien mit der gleichen 
Anzahl von Pixeln dargestellt wird, erscheint 
Linie A heller als B. Dies kann dadurch be- 
hoben werden, daß die zur Darstellung von 
B verwendeten Pixel mit der Y2-fachen In- 
tensität wie die für A verwendeten Pixel dar- 
gestellt werden. 


Abbildung 2.9: Spezialfälle von Kurven 
zweiter Ordnung. Angegeben sind die Glei- 
chungen für einen Kreis mit Radius R und 
Mittelpunkt im Ursprung, für eine (unge- 
drehte) Ellipse mit Mittelpunkt im Ursprung, 
eine Hyperbel, deren Achsen mit den Ko- 
ordinatenachsen zusammenfallen, und einer 
Parabel, deren Achse parallel zur y-Achse 
liegt. 


beschrieben. Spezialfälle dieser Gleichung sind in Abbildung 2.9 wiedergege- 
ben. Weitere Einzelheiten zu den verschiedenen Kegelschnitten findet man 
z.B. in [BS80]. Wir werden in diesem Abschnitt als Beispiel die Darstellung 
von Ellipsen untersuchen, vgl. [BG89]. Alle hier vorgestellten Verfahren lassen 
sich so abändern, daß sie zur Darstellung von anderen Kurven zweiter Ordnung 


verwendet werden können. 


2.2.1 Parametermethode 


Laut Abbildung 2.9 ist die Gleichung einer nicht gedrehten Ellipse mit Mittel- 


punkt im Ursprung 


ga (2.1) 
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x 
Abbildung 2.10: Links ist eine ungedrehte Ellipse mit Mittelpunkt im Ursprung wieder- 
gegeben. Die rechts abgebildete Ellipse entsteht aus der links abgebildeten durch Drehung 
um den Winkel $ und nachfolgender Verschiebung des Mittelpunktes zum Punkt (z.,%.). 


Dabei ist 2a die Länge der Hauptachse, 25 die Länge der Nebenachse, vgl. Ab- 
bildung 2.10. (2.1) ist die kartesische Darstellung einer Ellipse. Die in diesem 
Abschnitt vorgestellte Parametermethode benutzt die sogenannte Parameter- 
darstellung. In dieser Form wird eine Ellipse durch ein Paar von parametrisier- 
ten Gleichungen 


z=acos®d, y = bsın® 


mit 0 € [0,2r[| beschrieben. 6 ist der Parameter dieser Gleichungen. Für 
jeden Wert von 0 geben die beiden Gleichungen einen Punkt (z,y) an, der 
auf dem Rand der darzustellenden Ellipse liegt. Daß beide Darstellungen eine 
Ellipse beschreiben, sieht man durch Einsetzen der Parametergleichungen in die 
kartesische Gleichung: 


2 2 
z = 0 0+sin?0=1 


Die Gleichung einer um einen Winkel & gedrehten Ellipse mit Mittelpunkt 
(£.,Yc), vgl. Abbildung 2.10, lautet: 


T 


Yy 


acosdcosd — bsindgsind +2. = Acos# —- Bsin® + r. 


2.2 
asindcos® +bcosdsind+y.=Ccos#d+Dsind+y. 22) 


mit A= acosd, B = bsind, CÜ = asind, D = bcosd. Man erhält diese 
Gleichung durch Anwendung einer Rotation und einer Translation auf die un- 
gedrehte Ellipse mit Mittelpunkt im Ursprung. Wie wir in Abschnitt 3.1 sehen 
werden, wird die Rotation einer Punktmenge um einen Winkel & beschrieben 
durch Anwendung einer Rotationsmatrix auf alle Punkte der Punktmenge. Für 
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eine Ellipse bedeutet dies, daß (2,4) = (a cos 6, bsin #) mit der Rotationsmatrix® 
R- ( cosd sind ) 


-sind cosd 


multipliziert werden muß. Die nachfolgende Translation wird durch eine ansch- 
ließende Addition von (z.,y.) realisiert. 


Die Parametermethode berechnet zur Darstellung der Ellipse eine Folge von 
äquidistanten Parameterwerten und verbindet die zu benachbarten Parameter- 
werten gehörenden Ellipsenpunkte durch Geradensegmente: Sei n die Anzahl 
der Geradensegmente, mit denen die Ellipse angenähert werden soll. Dann ist 
AO = 2r /n die erforderliche Schrittweite für den Parameter 6. Beginnend mit 60 
= (0) berechnet man eine Folge von n +1 Parameterwerten durch 6; = 6;_\+A0, 
1<:<n. Zu jedem 9; wird nach Gleichung (2.2) ein Punkt (z;,y;) berechnet. 
Die Punkte (z;_1,y;-ı) und (z;,y;) werden durch ein Geradensegment verbun- 
den. Wegen 6, = do + 27 ist (20,Y0) = (£n,Yn)- Damit wird (2„-1,Yn-ı) mit 
(20,Yo) durch ein Geradensegment verbunden, die Ellipse wird also geschlos- 
sen. Für eine ungedrehte Ellipse mit Mittelpunkt im Ursprung ist der 6, = 0 
entsprechende Punkt (zo,yo) = (a,0). (z;,y:) liegt von (2;_1,yi-ı) aus gesehen 
ım Gegenuhrzeigersinn. Abbildung 2.11 zeigt eine Prozedur, die das Verfahren 
implementiert. 


Eine Reduzierung der Laufzeit erreicht man durch Ausnutzung der Symmetrie 
der Ellipse, vgl. Abbildung 2.12. Sei P(0) = (zo,yo) der zu Paramterwert 0 = 0 
gehörende Punkt der Ellipse. Sei P() = (xso,yso) der zu Paramterwert 9 = r 
gehörende Punkt der Ellipse. Sei P(#)= (zı,yı) für 0 < 0 < r ein beliebiger 
Punkt der oberen Halbellipse. Sei P(d+r) = (zsı,ysı) der zugehörige Punkt 
auf der unteren Halbellipse. Es gilt: 


ala 
Yo Yyı Ys1 Yso 
d.h. der Punkt (z,1,4s1) kann aus dem Punkt (zı,yı) durch zwei Additionen 


berechnet werden, wenn (2,0, Ys0)” — (£o,Yo)- vorberechnet wird. 6 braucht nur 
die Werte zwischen 0 und 7 zu durchlaufen. 


Der Nachteil der Parametermethode liegt in der festen Unterteilung der Parame- 
terpunkte. Dadurch wird die Annäherung der Ellipse durch Geradensegmente 
an Stellen mit starker Steigung ungenau, die einzelnen Geradensegmente sind 


3Man beachte, daß wir hier die Vektoren als Zeilenvektoren darstellen, d.h: wir bilden 
(z’,y') = (z,y)R. Wenn wir Spaltenvektoren verwenden würden, müßten wir die transpo- 


nierte Matrix RT verwenden : () = RT () 
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void ellipse (a,b,phi,xc,yc,n,value) 

float a,b,phi,xc,yc; 

int n, value; 

{ 

float cosphi,sinphi,theta,pi,costheta, 
sintheta,A,B,C,D,x0,x1,y0,yi,incr; 











int ji; 






pi = 4*rarctan(1); 
cosphi = sintab[pi/2+phi]; 
sinphi = sintab[phi]; 
A = arcosphi; B = b*sinphi; 
C = a*sinphi; D = b*cosphi; 
x0 = Atxc; yOsCtyc; 
theta=0; incr = 2*pi/n; 
for(j=1; j<=n; j++) { 

theta = thetatincr; 
costheta = sintab[pi/2+theta]; 
sintheta = sintab[theta]; 
x1 = Axcostheta-B*sinthetatxc; 
yl = C*kcostheta+tD*sinthetatyc; 
Draw_Linei(x0,y0,x1,yi,value); 
x0=x1; yO=-yl; 













Abbildung 2.11: Parametermethode zur Darstellung von Ellipsen: Die angegebene Pro- 
zedur stellt eine um einen Winkel phi gedrehte Ellipse mit Mittelpunkt in (xc,yc) dar. 
Zur Vermeidung der Berechnung der trigonometrischen Funktionen wird eine Tabelle 
verwendet, in der die Sinus-Werte zwischen 0 und 2” abgelegt sind. Die Beziehung 
cos4 = sin(2 + 0) wird zur Berechnung der Cosinus-Werte verwendet. Wenn die Bezie- 
hungen sin d = - sin(#- r) und sin 0 = sin(” —@) ausgenutzt würden, bräuchten nur die 
Sinus-Werte zwischen 0 und 7/2 abgelegt zu werden. Zur Darstellung der Geradenstücke 
wird eine Prozedur Draw_Linei verwendet, die sich von der Prozedur Draw_Line aus 
Abbildung 2.9. nur darin unterscheidet, daß die ersten vier Argumente Floating-Point- 
Werte statt Integerwerte sind, die zu Beginn der Prozedur durch Runden in Integerwerte 
umgewandelt werden. 
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(251; Ys1) 


(250, Yso) 





I 


Abbildung 2.12: Symmetrie einer um einen Winkel & gedrehten Ellipse. 


deutlich sichtbar. Das führt vor allem bei langen, schmalen Ellipsen zu einer 
schlechten Darstellung der Zonen um die Parameterwerte do =0 undd = rm. 
Diesen Nachteil kann man beheben, indem man eine nichtlineare Unterteilung 
der Parameterwerte wählt, die in Bereichen mit starker Steigung feiner ist als 
in Bereichen mit flachem Anstieg. 


2.2.2 Scangerade-Methode 


Die Scangerade-Methode nähert eine Ellipse nicht durch Geradensegmente an, 
sondern setzt einzelne Pixel, die auf dem Rand der Ellipse liegen. Dazu wird eine 
horizontale Scangerade verwendet, die über die darzustellende Ellipse geschoben 
wird. Für jede y-Position wird der Schnittpunkt zwischen der Scangerade und 
der Ellipse bestimmt. Für die Ellipse wird die kartesische Darstellung benutzt. 
Die kartesische Darstellung einer nicht gedrehten Ellipse mit Mittelpunkt im 
Ursprung lautet: 


I 


P+G)”=1 


q 


Eine Drehung um Winkel & und die Translation zum Punkt (z.,y.) erreicht 
man durch die Substitution: 
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zZ +- zcosd-ysind+r. 
y+ zsindg+ycosd+Y. 


Damit ist die kartesische Darstellung einer um den Winkel & gedrehten Ellipse 
mit Mittelpunkt (z.,ye.): 


(zcosd-ysind+z.)  (zsind+ycosd+ Ye)” 
TE TB 

Um die Berechnung zu vereinfachen, betrachten wir im folgenden eine gedrehte 
Ellipse mit Mittelpunkt im Ursprung. Die Translation zum Punkt (x.,y.) kann 
nach Berechnung der Punkte der unverschobenen Ellipse durch eine einfache 
Addition von (2.,yc) durchgeführt werden. Die x-Werte der Schnittpunkte mit 
der Scangeraden y = y; erhält man durch Einsetzen von y; in diese Gleichung 
und Auflösen nach ze: 


(x cos d - yisin $)” N (zsind+yicosd)” —ı 














a? b2 
Mit der Substitution 
p-9® a R=-y sind Sy, cos ® 
a b a b 


wird diese Gleichung zu 
(«P+R)+(2Q+S)’=1 
was gleichbedeutend ist mit 
z(P? +Q°)+2z:(PR;+QS)+R?+S?=1 


Auflösen nach z und Umformen liefert für die z-Werte der beiden Schnittpunkte 


-(PR;+Q5,) + 1/P°+Q2- (PS; - QRi)’ 


P2 + Q2 


Tı2 — 
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Dabei sind P und Q für eine gegebene Ellipse konstant, R; und $; sind von y; 
abhängig. Einsetzen von P, Q, R; und S; liefert für die @-Werte der beiden 


Schnittpunkte: 
212 = Kıy: + \/ K, + Kay? (2.3) 


Kı,K. und K3 sind Konstanten, die unabhängig von y; sind: 


cos dsin d(b? — a?) 


K re 0, 
' b2 cos? d + a2sin? d 
272 

Ken _ 

b? cos? d + a?sin’ d 

272 

K, = th _ 

(b? cos? + a? sin? $) 


Die z-Werte nach Gleichung 2.3 brauchen nur für solche Scangeraden berechnet 
zu werden, die die Ellipse auch wirklich schneiden. Deshalb bestimmt man die 
y-Werte, zwischen denen sich die darzustellende Ellipse erstreckt. Die Grenz- 
punkte der Ellipse sind die Punkte, an denen die Scangerade die Ellipse berührt. 
An diesen Grenzpunkten gibt es nur einen Schnittpunkt zwischen Scangerade 
und Ellipse, der Ausdruck unter der Wurzel in Gleichung 2.3 wird 0: 

a?b? 2 a 


b2cos?d+a2sind ”' (b? cos? + a? sin? #)? 0 


Auflösen nach y; liefert 


yı2 = t1/ b?cos?6d + a? sin” d 


yı gibt die obere, ya die untere y„-Ausdehnung der Ellipse an. Auch hier kann 
man wieder die Symmetrie der Ellipse ausnutzen, um die Laufzeit zu halbie- 
ren: Sei (z,y:) der obere, (z},%y5) der untere Scheitelpunkt der Ellipse (siehe 
Abbildung 2.13). Seien y= y —a und y = y +a zwei Scangeraden, die die 
Ellipse in den Punkten Pı = (zı,yı) und P = (z2,y2) bzw. Pi = (z1,y/) und 
P3 = (z3,y3) schneiden (<a< %(y —ys)). Dann gilt: 


ı = u -An = u -(m-e:) 


2.4 
zz, = u +An = nt (m -2ı) 24) 
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Abbildung 2.13: Aus- 
nutzung der Symmetrie der Ellipse bei 
der Scangeraden-Methode. 





Diese Symmetrie wird von dem Programm in Abbildung 2.14 ausgenutzt. 


Da immer horizontale Scangeraden verwendet werden, werden bei der beschrie- 
benen Methode in jeder Bildschirmzeile genau zwei Pixel gesetzt*. Dies kann 
je nach darzustellender Ellipse dazu führen, daß die Darstellung in Bereichen, 
in denen die Ellipse eine Steigung nahe 0 hat, unterbrochen erscheint, vgl. Ab- 
bildung 2.15. Eine Möglichkeit der Abhilfe besteht darin, für jedes zu setzende 
Pixel zu überprüfen, ob dieses vom zuletzt gesetzten einen c-Abstand von mehr 
als 1 hat. Wenn dies der Fall ist, werden die dazwischenliegenden Pixel entlang 
der Scangeraden gesetzt. Der negative Effekt läßt sich auch dadurch vermeiden, 
daß man für Bereiche der Ellipse, in denen die Steigung zwischen -1 und 1 liegt, 
vertikale statt horizontale Scangeraden verwendet, vgl. Abbildung 2.16. 


Zur Bestimmung der vier Punkte der Ellipse mit Steigung -1 oder 1 verwendet 
man am besten die Parameterdarstellung der Ellipse und bestimmt die vier 
Parameterwerte der gesuchten Punkte. Bei einer nicht gedrehten Ellipse erhält 
man die Steigung der Tangente an einen Punkt P der Ellipse durch Anwendung 
der Tangens-Operation auf den Winkel, den die Tangente mit der x-Achse 
bildet, vgl. Abbildung 2.17. Bei Drehung der Ellipse um den Winkel & dreht 
sich die Tangente mit. Wenn x der Winkel der ungedrehten Tangente mit der 
z-Achse ist, ergibt sich die Steigung der Tangente an den Punkt der gedrehten 
Ellipse zu tan(x + d). Die Tangente hat die Steigung 1, wenn 


tan(x+@)=1 


“Für die beiden Scangeraden, die die Ellipse berühren, wird nur ein Pixel gesetzt. 
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void ellipse (a,b,phi,xc,yc,value) 
float a,b,phi; 
int xc,yc,value; 
{ 
int xt,xb,yt,yb,xtr,xbr,ytr,ybr,xtl,xbl,ytl,ybl,LinesUsed; 
float Ki1,K2,K3,c2phi,s2phi; 


c2phi=cos(phi)*cos(phi); s2phi=sin(phi)*sin(phi); 
h = b*b*xc2phitaka*s2phi; 
yt=round(sqrt(h)); yb=-yt; 
K1 = (cos(phi)*sin(phi)*(b*b-aka))/h; 
K2 = (ataxb#+b)/h; K3 = -(ararb*b)/(h*h); 
xt = round(Ki*yt); xb=-xt; 
set_pixel(xt+xc,yt+yc,value); 
set_pixel(xb+xc,yb+yc,value); 
LinesUsed=(yt-yb+1)/2; 
for (i=1; i<=LinesUsed; i++){ 
yt--; 
xtl = round(Ki*yt-sqrt (K2+K3*ytxyt)); 
xtr = round(Ki*yt+sqrt(K2+K3*ytxyt)); 
yb = -yt; 
xbl=xb-(xtr-xt); xbr=exb+(xt-xtl); 
set pixel(xtl+xc,yt+yc,value); 
set_pixel(xtr+xc,yt+yc,value); 
set pixel(xbl+xc,yb+yc,value); 
set_pixel(xbr+xc,yb+yc,value); 





Abbildung 2.14: Erzeugung einer Ellipse mit der Scangeraden-Methode unter Ausnut- 
zung der im Text erwähnten Symmetrie. yt gibt die Lage der oberen, yb die Lage der 
unteren Scangeraden an. In jedem Schleifendurchlauf werden die Schnittpunkte der obe- 
ren Scangeraden mit der Ellipse explizit nach Formel 2.2. berechnet. Die Schnittpunkte 
mit der unteren Scangeraden werden mit Hilfe von Gleichung 2.3. berechnet. (xtl,yt1) 
gibt die Pixelkoordinaten des Punktes P, aus Abbildung 2.13 an. (xtr,ytr), (xbl,ybl) 
und (xbr,ybr) sind die Pixelkoordinaten der Punkte P,, Pi und P}. Die Plazierung des 
Mittelpunktes der Ellipse wird durch Addition von x. bzw. y. zu den x- bzw. y-Werten 
der gesetzten Pixel erreicht. 
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Abbildung 2.15: Für Bereiche 
mit flacher Steigung wird die Ellipse 
bei Verwendung der Scangeraden- 
Methode unterbrochen gezeichnet. 





Abbildung 2.16: Verwendung von 
vertikalen Scangeraden in Bereichen 
der Ellipse, in denen die Steigung zwi- 
schen -1 und 1 liegt. 


Abbildung 2.17: Tangente an eine 
Ellipse. 
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Dies ist erfüllt, wenn x = arctan(1)-& = m/4-d. Die zu einem Parameterwert 
6 gehörende Steigung der Ellipse ist | 

dy _ dy/dh _ bcosd mb 

dx dı/dO asind atand 











_—b_ 


an oder 


Die Steigung ist 1, wenn tanx = tan(r/4- d) = 


tand = TEE EEE 
 atan(m/4 — $) 

Da die Tangenten-Funktion die Periode m hat und der Parameter 6 die Werte 
zwischen 0 und 2” durchläuft, sind die beiden Parameterwerte, an denen die 
Steigung 1 ist: 


9, = arct (an ) 
ET atan (r/4- 6) (2.5) 
0, = 6, +7 


Analog erhält man die Parameterwerte, an denen die Steigung -1 ist als 


—b 
63 = arctan an tan (4 = 5) 2.6) 
04 = O3 +7 


Die Scangeraden-Methode eignet sich besonders gut zur Darstellung von aus- 
gefüllten Ellipsen. Man erhält eine ausgefüllte Ellipse, wenn man die vier 
set_pixel-Anweisungen in dem Programm aus Abbildung 2.14 ersetzt durch 
zwei Anweisungen zur Darstellung von horizontalen Linien zwischen den beiden 
Schnittpunkten der Scangeraden mit der Ellipse: 


DrawLine (xtl+xc,yt+yc,xtr+xc,yt+yc,value); 
DrawLine(xbl+xc,yb+yc,xbr+xc,yb+yc,value); 


Bei dem in diesem Abschnitt beschriebenen Verfahren wurde die Translation 
der Ellipse nachträglich durch Addition von (x.,y.) zu den Argumenten der 
set_pixel-Funktion durchgeführt. Dies braucht pro gesetztem Pixel weniger 
Operationen als das Berechnen der Schnittpunkte der Scangeraden mit der ver- 
schobenen Ellipse. Man könnte auch die Rotation nachträglich durchführen, 
indem man zuerst die Schnittpunkte der Scangeraden mit der ungedrehten El- 
lipse bestimmt und die errechneten Schnittpunkte nachträglich einer Rotation 
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unterwirft. Bei diesem Vorgehen werden aber pro gesetztes Pixel mehr Opera- 
tionen benötigt wie bei dem in diesem Abschnitt beschriebenen Verfahren: Die 
Berechnung der x-Werte der Schnittpunkte der Scangeraden y = y; mit der 
Ellipse erfordert eine Auflösung der kartesischen Gleichung (2.1) nach z: 


a? 2 
2. = tja - Sy; 


b2 


Bei Vorberechnung der konstanten Ausdrücke braucht man zur Berechnung von 
£ı,, zwei Multiplikationen, eine Addition und eine Wurzeloperation. Die Rota- 
tion eines errechneten Schnittpunktes (x,y) um den Winkel & 


x" 


! 


zcosd — ysind 


zsind+ycosd 


braucht vier Multiplikationen und zwei Additionen. Das in diesem Abschnitt 
beschriebene Verfahren braucht dagegen nur drei Multiplikationen, zwei Addi- 
tionen und eine Wurzeloperation. 


2.2.3 Differentielle Methode 


Die differentielle Methode zur Darstellung von Ellipsen arbeitet ähnlich wie der 
inkrementelle Algorithmus zur Darstellung von Linien. Wenn x die treibende 
Achse ist, findet man ausgehend von einem bereits dargestellten Punkt P; = 
(z;,y:) der Ellipse den nächsten Punkt P;}ı = (zi41,Yi+1) durch 


Lt] Yızyıtm 


Dabei ist m; umso größer, je größer die Steigung der Ellipse in der Nähe der 
Punkte P; und P;;ı ist. Für eine Gerade ist die Steigung und damit der addierte 
Wert konstant, für eine Ellipse ändert sich dagegen die Steigung von Punkt zu 
Punkt, m; muß daher für jeden Punkt neu berechnet werden. Wir werden jetzt 
das Verfahren etwas näher beschreiben. Dazu betrachten wir zuerst eine nicht 
rotierte Ellipse mit Mittelpunkt im Ursprung. Aus der Parameterdarstellung 


z=acos®, y = bsın 6 


dieser Ellipse ergibt sich die Ableitung nach # zu 
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= __gsind, ' au _ bcos 6 


d6 7; 


Eliminieren der trigonometrischen Funktionen liefert: 


was gleichbedeutend ist mit 
a b 
de=--yd$ und dy=-ıd 
b a 


Durch Diskretisieren erhält man: 


a b 


Ar=-zyA0 und Ay=-zA0 


Bei Änderung des Parameters 0 um Ad ändert sich z um Az und y um Ay. 
Bei Verwendung der Parameterschrittweite Ad ist also zi4ı = zi + Ar und 
yı+ı = yi+Ay. Arc ist abhängig von y, Ay ist abhängig von x. Es stellt sich die 
Frage, welcher Punkt (z,y) zur Berechnung von Ar und Ay verwendet wird. 
Eine Möglichkeit besteht darin, den Punkt (z;,y;) zu verwenden, d.h. es ist 


b 
uu=m- Ey Ad, Yuı=yi+ziA0 (2.7) 
Laut [BG89] hat dies den Nachteil, daß A9 sehr klein sein muß, damit die Ge- 


nauigkeit der errechneten Punkte ausreichend ist. Eine bessere Lösung besteht 
darin, den Punkt (Ar, yrvit) zu verwenden. Damit ist 


u ‚_4aYrtYır Lan butzu4 
Li+ = Ei Tr AG, yYHızyr 7 2 Ad (2.8) 


Auflösen nach z;+ı und y;+ı liefert 


zirı(d+A0®) = 2,(4- AN) -4y; z A0 
yar(a+A0®) = yild- AB) +4a; - AB 
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void ellipse(a,b,n,value) 
float a,b,pi; 
int n,value; 
{ 
float x0,y0O,x1,yi,dtheta,k1,k2,K3,K4; 
int j; 


pi = 4*arctan(1); 

x0=0; yO=b; 

dtheta=2*pi/n; 

ki = 4-dtheta*dtheta; 

k2 4+dtheta*rdtheta; 

k3 = 4*a/b*dtheta; 

k4 = 4xb/axdtheta; 

for (j=1; j<en; j++){ 
xi = (x0*k1-y0*k3)/k2; 
yi = (yOxk1+x0x*k4)/k2; 
DrawLinei(x0,y0,x1,yi,value) 
x0=x1; yO=yl; 





Abbildung 2.18: Erzeugung einer ungedrehten Ellipse mit Mittelpunkt im Ursprung mit 
Hilfe der differentiellen Methode erster Ordnung. (x0,y0) gibt den letzten errechneten 
Punkt an, (x1,y1) enthält den neu errechneten Punkt. Die Initialisierung von (x0,y0) 
erfolgt mit den Werten für # = m/2. 
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Damit läßt sich P;}ı aus P; berechnen. Abbildung 2.18 zeigt ein Programm, 
das diese Methode verwendet. Wenn man die Konstanten zusammenfaßt und 
schleifeninvariante Berechnungen aus der Schleife zieht, braucht die Darstellung 
einer Ellipse mit dieser Methode pro errechnetem Punkt vier Multiplikationen 
und zwei Additionen. 


Durch Verwendung des Differentials zweiter Ordnung kann man eine Verbes- 
serung der Laufzeit erreichen. Seien P;_,, P; und P;,ı drei in dieser Reihen- 
folge errechnete Punkte der Ellipse. Sei Az; = x; - x;-1, Ay; = si - Yı-ı, 
Azırı = Lip — x; und Ayıyı = Yirı — yi. Dann ist 


Ad, = Az - Ay; = zip - + 5;-1 


2.9 
Ay = Ayın - Ay = Yin - Wit Yı-ı 29) 
Die zweite Ableitung der Parameterdarstellung nach ® ergibt sich zu 
"= = = -acosd=-xr 
1 d?y (2.10) 
vn —bsind = -y 


Diskretisieren und Einsetzen der Ausdrücke für A®z und A®)y aus Gleichung 
(2.9) liefert bei Verwendung des Punktes P; = (z;,y;) in (2.10) für z;41 und ysyı 
die folgende Iterationsgleichung: 


2: (2 - (AB)?) - x;_ı 
y: (2 - (AB?) - y;-ı 


“ir (2.11) 


Yı+1 


Damit läßt sich der Punkt P;,ı aus P;_ı und P; berechnen. Man beachte, daß 
a und b in (2.11) nicht mehr auftreten, sie fließen nur über die Initialisierung 
der ersten beiden Punkte A und P; in das Ergebnis ein. Das resultierende 
Programm ist in Abbildung 2.19 wiedergegeben. Wenn man schleifeninvariante 
Berechnungen vor die Schleife zieht, braucht dieses Programm pro dargestelltem 
Geradensegment nur zwei Multiplikationen und zwei Additionen. 


Man beachte, daß das abgebildete Programm nur nicht-gedrehte Ellipsen dar- 
stellt, deren Mittelpunkt im Nullpunkt liegt. Wir werden jetzt auf die Verallge- 
meinerung für gedrehte Ellipsen eingehen, deren Mittelpunkt im Ursprung liegt. 
Die Verschiebung der Ellipse erreicht man wieder durch Addition der Koordi- 
natenwerte des gewünschten Mittelpunktes zu den Argumenten von DrawLine. 
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void ellipse (a,b,n,value) 
float a,b; 
int n,value; 
{ 
float x0,x1,x2,y0,yil,y2,dtheta,pi; 
int i; 


pi = 4*arctan(1); 

x0 = 0; yO=b; 

dtheta = 2*pi/n; 

xi = x0 - a/b*yO*dtheta; 

yi = y0 + b/a*x0*dtheta; 

DrawLinei(x0,y0O,xi1,yi,value); 

for (i=1; i<n; it+){ 
x2 = x1x*(2-dthetaxdtheta)-x0; 
y2 = yixr(2-dthetardtheta)-y0; 
DrawLinei(xi1,yi1,x2,y2,value); 
x0 = x1; y0 = yl; 
xl = x2; yl = y2; 





Abbildung 2.19: 
Erzeugung einer Ellipse mit der differentiellen Methode zweiter Ordnung. Die Initialisie- 
rung von xO und yO erfolgt mit den Werten für # = m/2. Zur Initialisierung von x1 und 
y1 wird die Formel (2.7) verwendet. 
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Die Parameterdarstellung einer gedrehten Ellipse im Ursprung ist: 


zr=Aws®-Bsind y=Ücosd+ Dsind (2.12) 
wobei 
A=acosd; B=bsin$; C=asind; D = bcos $; 


Zweimaliges Differenzieren nach 6 liefert: 


z' 


= - Asin® — Bcos6 y' = -Csind - Dcos0 
2" =-Acos#®+Bsin®=-ı y"= 


—-Cc0os0+Dsind = -y (2.13) 
Man hat also die gleiche Differentialgleichung wie für eine ungedrehte Ellipse. 
Der Unterschied zu einer ungedrehten Ellipse besteht in der Berechnung von 
Az. Aus (2.12) erhält man: 


Dz+By. 
AD + BC' 


Ay-Cz 


sind= In. Bo 


cos = 
Einsetzen in (2.13) liefert: 
X! =kıcrtky, y' = kat — kıy; 
mit 


_AC-BD 
 AD+BC 


—(A? + B?) C? + D? 


k [IL = —_ 
! AD+BC ’T AD+BC 


k,= 


Wegen x’ = dx/d@ und y’ = dy/d6 erhält man durch Diskretisieren: 


Azr=(kz+ky)A9 Ay (ksz - kıy)A0 


Damit ist bei Verwendung des Punktes (x;,y;) zur Berechnung von Az und Ay: 


2; + (kız, + kay:) AO 
yi + (kızi + kay:) AQ 


La = +ÄAz 


2.14 
yHı=yit Ayı (2.14) 
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Für die mit Hilfe des Differentials zweiter Ordnung errechneten Iterationsglei- 
chungen ergeben sich wegen der identischen Differentialgleichungen wieder die 
Formeln (2.11). Damit erhält man zur Darstellung einer gedrehten Ellipse bei 
Verwendung des Differentials zweiter Ordnung ein Programm, das sich nur in 
der Initialisierung von dem Programm in Abbildung 2.19 unterscheidet. Die 
Initialisierung wird mit den Gleichungen (2.14) vorgenommen, wobei die Initia- 
lisierung von (£o,Yo) wieder mit den Werten von für 6 = m/2 erfolgt: 


zo = -bsind; 

yo = bcos &; 

2zı = zo + (kızo + k2yo) AG; 
yı = Yo + (kszo — kıyo) A; 


Das resultierende Programm ist in Abbildung 2.20 wiedergegeben. 


Die bisher in diesem Abschnitt vorgestellten Verfahren zur Darstellung von El- 
lipsen mit Hilfe der differentiellen Methode errechnen Punkte auf der Ellipse 
und verbinden diese durch Geradensegmente. Dies hat den bereits bei der Pa- 
rametermethode beschriebenen Nachteil, daß die Darstellung an Stellen mit 
starker Steigung ungenau wird. Neben der in Abschnitt 2.2.1 vorgeschlagenen 
nichtlinearen Unterteilung kann man hier diesen Nachteil auch durch Elimi- 
nierung des Parameter A beheben. Dadurch erhält man ein Verfahren, das 
ähnlich wie der Bresenham-Algorithmus eine der beiden Koordinatenachsen 
als treibende Achse verwendet und das in jedem Schritt ein Pixel der Ellipse 
berechnet. Um dies anwenden zu können, unterteilt man die Ellipse in vier 
Bereiche, deren Grenzen die Punkte der Ellipse sind, an denen die Steigung 1 
oder -1 ist, vgl. Abbildung 2.21. Die Parameterwerte zu diesen Punkten findet, 
man in den Gleichungen (2.5) und (2.6). Die kartesischen Koordinaten der vier 
gesuchten Punkte erhält man durch Einsetzen dieser Parameterwerte in die Pa- 
rametergleichung (2.2) der Ellipse. Als Beispiel betrachten wir die Region, in 
der die Steigung der Ellipse zwischen -1 und 1 liegt. Dies ist in Abbildung 2.21 
der Bereich 1. In diesem Bereich ist x die treibende Achse. Das bedeutet, daß 
unmittelbar nacheinander gesetzte Pixel einen z-Abstand von 1 haben, es ist, 
also Az = 1. Der y-Abstand der Punkte P; und P;}ı sei yyı -yi = &. Aus 
(2.14) erhält man damit: 


Az; 
Ay; 


(kız; + kayı) AO =1 
(kzz; —_ kıy;) Ab = e& 


5Dies entspricht der Einteilung in Oktanden beim Bresenham-Algorithmus. 
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void ellipse (a,b,phi,xc,yc,n,value) 
float a,b,phi; 
int xc,yc,n,value; 


float x0,x1,x2,y0,yi,y2,dtheta,pi; 
int i; 


pi = 4*arctan(1); 

A = axcos(phi); B = b*sin(phi); 
a*sin(phi); D = b*cos(phi); 

k1 = (AxC-BxD)/(AxD + Bx*C) 

k2 = (ArA+B*B)/(A*D + B*C) 

k3 = (C*C+D*D)/(Ax*D + B*C) 


x0 = -B; y0=D; 
dtheta = 2*pi/n; 
xi = x0 + (ki*x + k2*y)dtheta; 
yi1 = yO + (k3*x - ki*ry)dtheta; 
DrawLinei (x0+xc,yO+yc,xi+txc,yi+tyc,value); 
for (i=1; i<=n; it+){ 
x2 = xi*(2-dthetardtheta)-x0; 
y2 = yi*(2-dtheta*dtheta)-y0; 
DrawLinei(xi+xc,yityc,x2+xc,y2+yc,value); 
x0 = xi; y0 = yl; 
xl = x2; yl = y2; 





Abbildung 2.20: 
Erzeugung einer allgemeinen Ellipse mit der differentiellen Methode zweiter Ordnung. 
Das Programm ist bis auf die Initialisierung von x0, yO, x1 und yi identisch mit dem 
Programm in Abbildung 2.19. 
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Abbildung 2.21: Einteilung einer EI- 
lipse in vier Bereiche: Im Bereich 1 ist 
x die treibende Achse, y wird inkre- 
mentiert. Im Bereich 2 ist y die trei- 
bende Achse, z wird inkrementiert. 
Im Bereich 3 ist z die treibende Achse, 
y wird dekrementiert. Im Bereich 4 ist 
y die treibende Achse, z wird dekre- 


mentiert. 
Eliminieren von AB liefert für e;: 
ee: = kt; — kıyi 
kızit koy: 


Mit 21 = 2%; +lund yyı =yi + e; erhält man für e;+ı: 


a... Marin — kıyin _ kai = kıyi + ka — hıci 
Mrz +koyını kımitkayi+kı + kue; 


Man kann damit also e;}ı in Abhängigkeit von z;, y; und e; berechnen. e; 
spielt die gleiche Rolle wie die Variable error beim Bresenham-Algorithmus, 
vgl. Abschnitt 2.1.2: Wenn (z,y) das im :-ten Schritt gesetzte Pixel ist, gibt 
e;; an, um wieviel das Pixel (£ + 1,y) von der idealen Position auf der Ellipse 
abweicht. Wenn —0.5 < e;;1 < 0.5, liegt das Pixel (r + 1,y) am nächsten zur 
idealen Position und wird gesetzt. Wenn e;}ı < —0.5, wird das Pixel (£+1,y—1) 
gesetzt. Wenn e;}ı > 0.5, wird das Pixel (2 +1,y-+ 1) gesetzt. Wenn man e;;1 
darstellt als 


. Ti+1 
i+1 7 B 
i+1 





kann man mit der Initialisierung 
To = k3£o — kıyo Bo = kıto + kayo 
und der Iterationsformel 


Tr =Ti+tks - kıe&i Bi = Bi+kı + ke 
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e;+ı iterativ mit zwei Multiplikationen, einer Division und vier Additionen pro 
Iterationsschritt berechnen. Eine Multiplikation kann man einsparen, wenn man 


ce, als 


ka. _n. 
kı 3 Y; 
ec>= 
5 
Li kı Y; 
darstellt. Dann ist: 
a Ba 
2. _ kı + + _ kı v t kı s 
1 kz k, k, 
Lit Pr En + RL +1+ Pb 
und damit: 
Tu =Ti+2-e 
kı 


Bu = Bi+1+ 2e, 
kı 
Nach Zusammenfassen der Konstanten benötigt man zur Berechnung von e;;ı 
nur noch eine Multiplikation, eine Division und vier Additionen. Für die be- 
trachtete Region der Ellipse ergibt sich daraus das Programm in Abbildung 
2.22. Die Verallgemeinerung auf alle Regionen der Ellipse kann anhand der in 
Abbildung 2.21 beschriebenen, treibenden Achsen erfolgen. 


2.3 Füllen von Polygonen und geschlossenen 
Kurven 


Wir werden uns in diesem Abschnitt damit beschäftigen, wie man Polygone 
und allgemeine geschlossene Kurven für die Darstellung auf dem Bildschirm 
mit einem vorgegebenen Farbwert ausfüllen kann. Wir werden in diesem Ab- 
schnitt zwei Algorithmen vorstellen, die unterschiedliche Voraussetzungen für 
die Spezifikation des zu füllenden Bereiches machen. Der erste Algorithmus 


ist ein Scangeraden-Algorithmus, siehe [FvDFH90], ähnlich dem in Abschnitt 
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void ellipse (a,b,phi,xc,yc,n,value) 
float a,b,phi; 

int xc,yc,n,value; 
{ 

float y,‚x1,x2,x3,x4,y1,y2,y3, y4,A,B,C,D,k1,k2,k3, 

T,B,e,thetai,theta2,theta3,theta4,pi 

int x; 

pi = 4*arctan(1); 

A = axcos(phi); B = b*sin(phi); 

C = axsin(phi); D = b*cos(phi); 

k1 = (AxC-BxD)/(Ax*D+B*C) 

k2 = (AxA+BxB)/(A*D+B*C) 

k3 = (C*C+Dx*D)/(A*D+B*C) 

thetal = arctan(-b/a*tan(pi/4-phi)); 

theta2 = thetaltpi; 

theta3 = arctan(-b/a*tan(-pi/4-phi)); 

theta4 = theta3+pi; 

x1 = arcos(thetal); yi = b*sin(thetal); 

x2 = axcos(theta2); y2 = b*sin(theta2); 

x3 = axcos(theta3); y3 = b*sin(theta3); 

x4 = axcos(theta4); y4 = b*sin(theta4); 
cosphi=sintab[phi+90]; sinphi=sintab[phi]; 

T = k3/k1*x4-y4; B = x4+k2/kiry4; e = T/B; 

for (x=round(x4) ,‚y=round(y4); x<=xi1; x++){ 

set pixel(x,round(y),value); 

= T+k3/k1-e; 
B+1+k2/ki*e; 
T/B; y = yte; 






















WW +4 
| 


Abbildung 2.22: Differentielle Methode zur Erzeugung einer Ellipse nach Eliminierung 
des Parameters 4. thetal, theta2, theta3 und theta4 sind die Parameterwerte der 
Punkte P; = (xi1,y1), P, = (x2,y2), Ps = (x3,y3) und P4 = (x4,y4), an denen die 
Steigung 1 oder -1 ist. Das Programm nimmt an, daß die Region 1 sich zwischen P4 und 
P, erstreckt. Das Programm stellt nur die Region 1 der Ellipse dar, vgl. Abbildung 2.21. 
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Abbildung 2.23: Zwei überlappende 
Polygone vor und nach dem Einfärben 
mit der Grenzpixelfarbe. Nach dem 
Einfärben ist das genaue Aussehen der 
beiden Polygonen nicht mehr feststell- 
bar. Ohne ein Zurückgreifen auf die 
geometrische Definition der Polygone 
ist der Füllvorgang irreversibel. 





2.2.2 beschriebenen, der anımmt, daß der zu füllende Bereich durch eine geo- 
metrische Beschreibung gegeben ist. Wenn der zu füllende Bereich das Innere 
eines Polygons ist, besteht die geometrische Beschreibung z.B. aus einer Liste 
von Kantenbeschreibungen, wobei zur Beschreibung einer Kante die Angabe 
von Anfang- und Endpunkt ausreicht®. Der zweite Algorithmus, der Saatfüll- 
Algorithmus, vgl. [BG89], nimmt an, daß der zu füllende Bereich bereits auf 
dem Bildschirm dargestellt ist. Damit liegt im Pufferspeicher eine implizite 
Beschreibung des Bereiches in Form der Intensitätswerte der Pixel, die das 
umgebende Polygon darstellen. Eine geometrische Beschreibung des Polygons 
wird nicht benötigt”. Der Saatfüll-Algorithmus wird typischerweise in interak- 
tiven Konstruktions- und Entwurfssystemen eingesetzt, bei denen ein Benutzer 
nach der Spezifikation eines Polygons angibt, daß dieses mit einem bestimm- 
ten Farbwert gefüllt werden soll. Dies kann z.B. dadurch geschehen, daß er den 
Bildschirmzeiger ins Innere des Polygons positioniert und mit einem Mausknopf 
klickt. Bei dem zu füllenden Bereich kann es sich auch um den Schnitt zweier 
Polygone handeln. Man beachte, daß bei alleiniger Verwendung des Saatfüll- 
Algorithmus das Füllen mehrerer überlappender Polygone mit dem gleichen 
Farbwert, mit dem die Grenzen des Polygons definiert sind, ein irreversibler 
Vorgang sein kann, vgl. Abbildung 2.23. 


2.3.1 Scangeraden-Methode 


Ein Scangeraden-Verfahren wurde bereits in Abschnitt 2.2.2 zum Zeichnen von 
Ellipsen verwendet. Ebenso wie dort schieben wir zum Füllen eines Polygons 
P eine Scangerade s parallel zur z-Achse von unten nach oben über P und 


6Wir werden im folgenden annehmen, daß es sich bei dem zu füllenden Bereich um ein 
Polygon handelt. Die vorgestellten Algorithmen sind aber ebensogut anwendbar, wenn als 
Kanten des Polygons beliebige Kurvensegmente zugelassen sind. 

"Zu dem ausgewählten Polygon gibt es natürlich eine geometrische Definition. Diese ist 
aber nicht direkt zugänglich, sondern müßte zuerst in der Beschreibung des darzustellenden 
Bildes gesucht werden. 
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Abbildung 2.24: Die Anzahl der 
Schnittpunkte zwischen einer Scange- 
raden und einem konvexen Polygon ist 
immer gerade. Im dargestellten Fall 
gibt es vier Schnittpunkte $; bis 54, 
die die Scangerade in fünf Segmente 
einteilen. Die Segmente (51,52) und 
(53,54) liegen innerhalb des Polygons. 


Abbildung 2.25: Schnittpunkte zwi- 
schen einer Scangeraden und einem 
Polygon P, das aus den Kanten a bis 
d besteht. Für die Scangerade y = 0 
werden die Kanten a und 5, für die 
Scangerade y = 2 werden die Kanten 
c und d geschnitten. Für die Scan- 
gerade y = 4 wird kein Schnittpunkt 


(2.0) gezählt. 





berechnen die Schnittpunkte zwischen P und s. Für konvexe Polygone gibt 
es genau zwei Schnittpunkte oder keinen. Für konkave Polygone gibt es im- 
mer eine gerade Anzahl von Schnittpunkten $1,-:-: S3n, die nach steigenden 
z-Werten geordnet seien, siehe Abbildung 2.24.? Die Schnittpunkte unterteilen 
die Scangerade in Segmente. Das Segment zwischen Sy-ı und S,,1<i<n 
liegt innerhalb des Polygons und wird eingefärbt. An Knotenpunkten des Po- 
lygons überlappen zwei Kanten. Damit auch in dem Fall, daß die Scangerade 
das Polygon in einem Knoten schneidet, die richtige Anzahl von Schnittpunkten 
bestimmt wird, ordnen wir jeder Kante e eine y„-Ausdehnung (Yymin(E), Ymaz(E)) 
zu und vereinbaren, daß e zwar die Scangerade y = Ymin(e) in einem Punkt 
schneidet, nicht aber die Scangerade y = Ymaz(e)”, vgl. Abbildung 2.25. Da 
horizontale Scangeraden verwendet werden, können horizontale Kanten des Po- 
lygons ignoriert werden. Das entsprechende Segment wird trotzdem eingefärbt, 
weil die Schnittpunkte mit den angrenzenden Kanten dies sicherstellen!”. 


8Wir werden im folgenden Punkte zur Unterscheidung von Skalaren immer mit Querstrich 
darstellen, vgl. auch Abschnitt 3.1. | 

°Die umgekehrte Vereinbarung ist ebenfalls möglich. 

10Man beachte, daß die Pixel auf horizontalen Kanten, die das Polygon nach oben be- 
grenzen, nicht gezeichnet werden, weil für die beiden angrenzenden Kanten die Endpunkte 
mit y-Wert ymaz nicht als Schnittpunkte gerechnet werden. Da die nach unten benachbarte 
Pixelreihe aber gesetzt wird, fällt dies kaum auf. 
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Abbildung 2.26: Füllen eines über 
Polygon die Bildschirmgrenzen hinausragen- 
den Polygons. Wenn nur die 
geclippten Polygonkanten an den 
Scangeraden-Algorithmus übergeben 
y=@ werden, kann dieser für die Scange- 
rade y = « nicht bestimmen, ob 
die entsprechende Bildschirmzeile in- 
nerhalb oder außerhalb des Polygons 

liegt. 





Vorsicht ist beim Füllen eines Polygons geboten, das über den Bildschirmrand 
hinausragt, vgl. Abbildung 2.26. In diesem Fall wird das Polygon vor der Dar- 
stellung auf dem Bildschirm bzgl. des Bildschirms geclippt, siehe Abschnitt 2.4 
für die Beschreibung von Olip-Algorithmen. Beim Clippen wird der Schnitt 
jeder einzelnen Polygonkante mit dem Rand des Bildschirms berechnet und die 
innerhalb des Bildschirms liegenden Kantenteile werden auf dem Bildschirm 
dargestellt. Dabei reicht es nicht aus, nur die innerhalb des Fensters liegenden 
Kantensegmente an den Scangeraden-Algorithmus weiterzugeben, weil dieser 
dann für bestimmte Scangeraden nicht bestimmen kann, welcher Bereich in- 
nerhalb des Polygons liegt und welcher außerhalb, siehe Abbildung 2.26. Statt 
dessen müssen die Teile des Fensterrandes, die innerhalb des Polygons liegen, als 
zusätzliche Polygonkanten an den Scangeraden-Algorithmus übergeben werden. 


Für das Einfärben des spezifizierten Polygons P, das sich zwischen ymin(P) 
und Ymaz(P) erstrecke, mit dem Scangeraden-Algorithmus gibt es zwei mögli- 
che Vorgehensweisen: Die naheliegende besteht darin, die Scangeraden zwischen 
Ymin(P) und Ymaz(P) zu durchlaufen und für jede Scangerade die Schnittpunkte 
S1,°**,9gn mit P zu berechnen. Dazu muß für jede Scangerade der Schnitt mit 
allen Polygonkanten berechnet werden. Die Segmente zwischen den Schnitt- 
punkten Sy_ı und 54, 1 <i <n, werden eingefärbt. Eine Implementierung 
verwendet eine geschachtelte Schleife. Die äußere Schleife läuft über die Scange- 
raden, die innere Schleife läuft über die Polygonkanten. Eine eflizientere Lösung 
erhält man, wenn man statt dessen die äußere Schleife über die Polygonkanten 
laufen läßt und mit jedem Durchlauf der inneren Schleife für eine Polygon- 
kante e alle Schnittpunkte mit allen Scangeraden zwischen ymin(e) und Ymaz(E) 
berechnet. Die gefundenen Schnittpunkte werden in einer Datenstruktur abge- 
legt, die für jede Scangerade zwischen Ymin(P) und Ymaz(P) die Schnittpunkte 
mit den Polygonkanten enthält. Nachdem alle Schnittpunkte berechnet sind, 
wird die Datenstruktur durchlaufen und für jede Scangerade werden die ent- 
sprechenden Segmente mit dem gewünschten Farbwert ausgefüllt. Der Grund 
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dafür, daß die zweite Lösung effizienter als die erste ist, obwohl sie zusätzlichen 
Aufwand für die Verwaltung der Datenstruktur erfordert, liegt darin, daß für 
die Berechnung der Schnittpunkte der Polygonkanten mit einer Scangeraden ein 
inkrementeller Algorithmus verwendet werden kann, z.B. eine modifizierte Ver- 
sıon des Bresenham-Algorithmus. Wir werden im folgenden noch etwas näher 
darauf eingehen. 


Zuerst beschreiben wir die Datenstruktur, in der die Schnittpunkte abgelegt 
werden. Jede Scangerade wird durch einen y-Wert Yscan eindeutig beschrie- 
ben. Die Schnittpunkte einer Scangeraden y = Yscan mit dem Polygon P 
werden in einer Liste abgespeichert, die nach steigenden z-Werten geordnet 
ist. Dabei braucht in jedem Listenelement nur der z-Wert des Schnittpunktes 
abgespeichert zu werden, der y-Wert ist Yscan. Die für die einzelnen Scange- 
raden erstellten Listen werden ebenfalls in einer Liste abgespeichert, die nach 
steigenden y-Werten der Scangeraden geordnet ist und die die Schnittpunkte 
mit allen Scangeraden zwischen ymin(P) und Ymaz(P) enthält. Die Datenstruk- 
tur für das Polygon aus Abbildung 2.25 ist in Abbildung 2.27 wiedergegeben. 
Zum Aufbau der Datenstruktur werden alle Polygonkanten durchlaufen und für 
jede Kante wird der Schnittpunkt mit allen Scangeraden berechnet. Für eine 
Polygonkante e mit unterem Endpunkt A = (zı,yı) und oberem Endpunkt B 
= (22,42) gibt es einen Schnittpunkt mit der Scangeraden y = yı an Stelle 
£ı. zı wird daher in die Liste der Schnittpunkte für die Scangerade y = yı 
einsortiert. Die Schnittpunkte mit den anderen Scangeraden werden mit einer 
modifizierten Version des Bresenham-Algorithmus berechnet. Wenn e eine Stei- 
gung zwischen 0 und 1 hat, läuft der Bresenham-Algorithmus über die z-Werte 
und berechnet in der Variablen error die y„-Abweichung von der idealen Linie. 
Wenn beim Bresenham-Algorithmus der y-Wert des zu setzenden Pixels inkre- 
mentiert wird, ist der Schnittpunkt von e mit der benachbarten Scangeraden 
gefunden und wird in die Datenstruktur einsortiert. Die benachbarte Scange- 
rade wird zur aktuellen Scangerade. Dieser Prozeß wird wiederholt, bis die 
Scangerade y = y, erreicht ist. Nachdem die Datenstruktur vollständig aufge- 
baut ist, wird sie zum Füllen von P Scangerade für Scangerade durchlaufen. 
Seien 51,‘ - ‚99 die für eine Scangerade y = Yscan in die Datenstruktur einge- 
tragenen Schnittpunkte mit den z-Werten zı,' ‚22. Die Pixel (23-1, Yscan) 
bis (22, Yscan) werden für 1 < : < n auf den Farbwert des Polygons gesetzt. 
Abbildung 2.29 zeigt eine Programmskizze. 


Das gerade beschriebene Verfahren hat den Nachteil, daß für die Ablage der 
Datenstruktur relativ viel Platz verbraucht wird. Im schlechtesten Fall er- 
gibt sich der Platzbedarf als das Produkt aus der Anzahl der Polygonkanten 
und der Anzahl der Scangeraden. Man kann den Platzbedarf durch folgendes, 
in [FvDFH90] beschriebene Verfahren reduzieren: Vor der eigentlichen Schnitt- 
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Abbildung 2.27: Datenstruktur 
zur Ablage der Schnittpunkte zwi- 
schen Scangerade und Polygon: Die 
Schnittpunkte zu einer Scangera- 
den werden in einer Liste gehalten, 
die nach steigenden z-Werten der 
Schnittpunkte sortiert ist. Der zu- 
gehörige y-Wert wird durch die Lage 
der Scangeraden spezifiziert. In der 
Abbildung sind der Übersichtlichkeit 
wegen noch die Kantenbezeichnun- 
gen aus Abbildung 2.25 wiedergege- 
ben. Für eine Implementierung brau- 
chen diese nicht abgespeichert zu wer- 
den. 





punktberechnung erstellt man mit bucket sort, siehe z.B. [Meh84b], eine Kanten- 
liste, die alle Kanten nach der y-Koordinate ihres unteren Endpunktes sortiert 
enthält. Dabei wird für jede in Frage kommende Scangerade ein bucket ver- 
wendet. Innerhalb eines buckets sind die Kanten nach der x-Koordinate ihres 
unteren Endpunktes sortiert. Jeder Eintrag in der Kantenliste enthält die y- 
Koordinate des oberen Endpunktes, die c-Koordinate des unteren Endpunktes 
und den Inkrementwert bzgl. x beim Fortschreiten von einer Scangeraden zur 
nächsten. Die Kantenliste kann in Zeit O(n) erstellt werden, wenn n die An- 
zahl der Polygonkanten ist. Der Platzbedarf ist ebenfalls O(n). Zum Füllen des 
Polygons wird eine aktive Kantenliste verwendet, die für die jeweils betrach- 
tete Scangerade y = Yscan alle Schnittpunkte mit den Polygonkanten, sortiert 
nach der x-Koordinate des Schnittpunktes, enthält. Der Platzbedarf für die 
aktive Kantenliste ist ebenfalls O(n), obwohl üblicherweise nur einige wenige 
Kanten in der Liste sind. Die durch die in der aktiven Kantenliste enthaltenen 
Schnittpunkte definierten Segmente werden wie bereits beschrieben ausgefüllt. 
Beim Übergang zur Scangerade y = Yscan + 1 wird die aktive Kantenliste ak- 
tualisiert: In der aktiven Kantenliste enthaltene Kanten werden entfernt, falls 
sie von der neuen Scangeraden nicht geschnitten werden. Die Kanten, die im 
bucket der Kantenliste zur Scangeraden y = Yscan + 1 enthalten sind, werden 
in die aktive Kantenliste aufgenommen. Die Schnittpunkte von y = Yscan + 1 
mit allen bereits in der Kantenliste enthaltenen Kanten werden unter Zuhil- 
fenahme des abgespeicherten Inkrementwertes neu berechnet. Da dadurch die 
z-Koordinaten der Schnittpunkte für nicht-horizontale Kanten sich ändern, 
muß die Liste danach neu sortiert werden. Die aktive Kantenliste enthält übli- 
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struct scanline f 
struct xpixlist *list; 
struct scanline *next; 
int ypix; 


} 


struct xpixlist { 
int xpix; 
struct xpixlist *next; 





Abbildung 2.28: Datenstruktur zu Abbildung 2.29. 


cherweise recht wenige Kanten und durch die Neuberechnung der Schnittpunkte 
entsteht normalerweise nur wenig Unordnung. Für das Sortieren kann deshalb 
bubble sort, d.h. Sortieren durch Vertauschen benachbarter Elemente, verwendet 
werden. 


Der ursprüngliche Bresenham-Algorithmus setzt für Linien mit flacher Steigung 
in einer Bildschirmzeile mehrere Pixel. Bei der Bestimmung der Schnittpunkte 
nach der gerade beschriebenen Methode wird aber nur das linkeste Pixel als 
Schnittpunkt in die Datenstruktur eingetragen. Dies kann dazu führen, daß bei 
flachen Kanten auf der rechten Seite eines Polygons einige Pixel, die noch zum 
Polygon gehören, nicht gezeichnet werden, siehe Abbildung 2.30. Die Bild- 
schirmdarstellung des gefüllten Polygons ist dann etwas kürzer als die des 
ungefüllten. Man kann diesen Effekt beheben, indem man den modifizierten 
Bresenham-Algorithmus nicht nur zur Bestimmung der Schnittpunkte benutzt, 
sondern auch dazu, die von der Normalversion gesetzten Pixel auf den gewünsch- 
ten Farbwert zu setzen. 


Für beliebige Kurven als Grenzen der zu füllenden Region muß nur die Berech- 
nung der Schnittpunkte geändert werden. Wenn die Kurve mit einem differen- 
tiellen Algorithmus gezeichnet werden kann, wie dies z.B. für eine Ellipse der 
Fall ist, kann dieser zur Berechnung des Schnittpunktes verwendet werden. 


2.3.2 Saatfüllen 


Der Saatfüll-Algorithmus wird benutzt, um Bereiche des Bildschirms zu füllen, 
deren umgebende Polygone bereits auf dem Bildschirm dargestellt sind. Für 
das Einfärben wird nicht wie beim Scangeraden-Algorithmus eine geometrische 
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void scan fill(P,value); 
polygon P; 
int value; 
{ 
struct scanline D; 
int ymin,ymax,yl,y2,scan; 
















remove horizontal _edges(P); 
ymin = min_extend polygon(P); 
ymax = max_extend _polygon(P); 
create scan list(D,ymin,ymax); 
for (i=0; i<number_of_edges(P); i++) do { 
yi = min_extend(e); y2 = max_extend(e); 
for (scan=yl;scan<=y2;scan++) do{ 
x = first value(e,scan); 
insert(D,x); 
} 
} 
for(scan=ymin;scan<=yax;scan++) do 
fill pixel(D.list,scan,value); 


Abbildung 2.29: Programmskizze zum Füllen eines Polygons mit der Scangeraden- 
Methode. Die Datenstruktur scanline ist in Abbildung 2.28 wiedergegeben. 
remove horizontal_edges(P) entfernt die horizontalen Polygonkanten in Polygon 
P. min_extend polygon(P) und max_extend_ polygon(P) bestimmen den minima- 
len und den maximalen y-Wert, zwischen denen sich das Polygon P erstreckt. 
create scan_list(D,ymin,ymax) erzeugt für jede zwischen ymin und ymax liegende 
Scangerade einen Listeneintrag vom Typ struct xpixlist in der Datenstruktur D. 
min_extend(e) und max_extend(e) bestimmen den minimalen und den maximalen y- 
Wert, zwischen denen sich die Kante e erstreckt. first_value(e,scan) bestimmt mit 
Hilfe einer modifizierten Version des Bresenham-Algorithmus den z-Wert des linkesten 
Pixels, das bei der Darstellung der Kante e in der von scan angegebenen Bildschirmzeile 
gesetzt wird. Wenn die durch scan angegebene Liste D.list 2n z-Werte enthält, setzt 
fill pixel(D.list,scan,value) für 1 << n alle zwischen dem (2: — 1)-ten und 
dem (2i)-ten z-Wert liegenden Pixel der von scan spezifizierten Bildschirmzeile. 
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Abbildung 2.30: Auf der rechten Seite des 
Polygons werden einige Pixel beim Füllen 
nicht gesetzt. In der Abbildung sind die 
mit dem im Text beschriebenen Verfah- 
ren berechneten Schnittpunkte als e darge- 
stellt, die vom ursprünglichen Bresenham- 
Algorithmus zusätzlich gesetzte Pixel als o. 
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Beschreibung des umgebenden Polygons verwendet, sondern die von der Dar- 
stellung auf dem Bildschirm herrührende, im Pufferspeicher vorliegende, impli- 
zite Beschreibung, die die Grenzpixel durch eine spezielle Grenzfarbe definiert. 
Die Grundidee des Saatfüll-Algorithmus besteht darin, daß man ausgehend 
von einem Pixel in dem zu füllenden Bereich - dem Saatkorn - alle Nachbar- 
pixel auf die Füllfarbe setzt, und dies rekursiv so lange wiederholt, bis man 
an den Grenzpixeln angekommen ist. Eine Programmskizze ist in Abbildung 
2.31 wiedergegeben. Man beachte, daß für die diagonal benachbarten Pixel 
keine rekursiven Aufrufe gestartet werden, weil sonst Polygone, deren Kanten 
mit dem Bresenham-Algorithmus gezeichnet wurden, nicht korrekt eingefärbt 
werden können, vgl. Abbildung 2.32. 


Der Nachteil der rekursiven Implementierung aus Abbildung 2.31 liegt im hohen 
Aufwand für die Verwaltung der rekursiven Aufrufe. Dies tritt besonders dann 
nachteilig auf, wenn große Bereiche des Bildschirms eingefärbt werden sollen, 
und kann zu Überläufen des Rekursionsstacks führen. Eine Implementierung des 
Stack im Programm reduziert zwar den Platzbedarf für den Rekursionsstack, 
weil organisatorische Einträge in den Stackrahmen eingespart werden können, 
braucht aber trotzdem noch viel Platz und Zeit, weil für jedes einzufärbende 
Pixel vier Stackoperationen ausgeführt werden. Abhilfe schafft die Einführung 
von Pirelläufen: Ein Pixellauf umfaßt eine Gruppe von horizontal benachbar- 
ten Pixeln, die auf beiden Seiten von Pixeln der Grenzfarbe abgeschlossen wird 
und die kein Pixel der Grenzfarbe enthalten. Ein Pixellauf wird im folgen- 
den durch seinen rechtesten Pixel repräsentiert!!. Pixelläufe können iterativ 
durch eine Schleife ausgefüllt werden. Dazu beginnt man mit dem Ausfüllen 
des Pixellaufs, der das Startpixel enthält, indem man von diesem ausgehend 
nach rechts und links läuft, bis man auf ein Pixel der Grenzfarbe trifft, und 
alle dazwischenliegenden Pixel auf die Füllfarbe setzt. Danach werden die Pixel 
in den beiden nach oben und unten benachbarten Zeilen untersucht und das 
rechteste Pixel jedes gefundenen Pixellaufes wird auf dem Stack gespeichert. 


_ HDer linkeste wäre ebensogut möglich. 
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void seed_fill(x,y,bcol,fillcol) 

int x,y,bcol,fillcol; 

{ 

if ((pixel_ value(x,y) != bcol) && 
(pixel value(x,y) != fillcol)){ 
set pixel(x,y,fillcol); 

seed fill(x+1,y,bcol,fillcol); 

seed fill(x-1,y,bcol,fillcol); 

seed fill(x,y+1,bcol,fillcol); 

seedfill(x,y-1,bcol,fillcol); 










Abbildung 2.31: Prozedur zum Saatfüllen eines Bildschirmbereiches, dessen Grenzen 
durch Pixel der Farbe bcol definiert sind. £fillcol ist die Farbe, mit der ausgefüllt werden 
soll. pixel_value(x,y) ist eine Prozedur, die den im Pufferspeicher abgelegten Farbwert 
des Pixels (x,y) zurückliefert. Beim ersten Aufruf von seed fill(x,y,bcol,fillcol) 
muß (x,y) ein Pixel innerhalb des zu füllenden Bereiches sein. 
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Abbildung 2.32: Wenn für das Füllen auch in diagonaler Richtung rekursive Aufrufe 
abgesetzt werden, kann sich ein Saatkorn diagonal durch die Polygonkanten hindurch 
vermehren und unkontrolliert weiterwachsen. 
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Abbildung 2.33: Zwischenschritte des im Text beschriebenen Algorithmus. & stellt 
das Saatkorn dar, e sind die Grenzpixel des zu füllenden Polygons, o sind die bereits 
aufgefüllten Pixel. Links oben ist die Situation nach dem Auffüllen des Pixellaufs, der das 
Saatkorn enthält, wiedergegeben. Die beim Auffüllen gefundenen Nachbar-Pixelläufe sind 
mit 1-4 bezeichnet und werden in dieser Reihenfolge auf den Stack gespeichert. Rechts 
oben ist die Situation nach dem Auffüllen des Pixellaufs 4 wiedergegeben, der als oberstes 
auf dem Stack liegt. Beim Auffüllen werden zwei neue Pixelläufe 4 und 5 entdeckt. 


Alle auf dem Stack befindlichen Pixelläufe werden nacheinander mit demselben 
Verfahren eingefärbt. Das Polygon ist vollständig eingefärbt, wenn der Stack 
leer ist. Ein typisches Beispiel für den Ablauf des Verfahrens findet man in 
Abbildung 2.33. Eine weitere Verbesserung der Laufzeit erreicht man, indem 
man verhindert, daß für eine Bildschirmzeile mehrfach die in ıhr enthaltenen 
Pixelläufe bestimmt werden. 


2.4 Clippen von Polygonen 


Eine in der Computergraphik häufig auftretende, grundlegende Operation ist 
das Abschneiden von Geradensegmenten bzgl. eines Polygons. Diese Opera- 
tion, die meist als Clippen bezeichnet wird, spielt unter anderem eine große 
Rolle bei der Bestimmung der sichtbaren Oberflächen einer dreidimensionalen 
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Szene, vgl. Kapitel 4. Wir werden uns hier zuerst mit dem Spezialfall des Clip- 
pens bzgl. eines rechteckigen Bereiches beschäftigen, der z.B. für das Olippen 
von Objekten bzgl. eines auf dem Bildschirm dargestellten Fensters angewendet 
werden kann. Dazu werden wir den Algorithmus von Cohen und Sutherland, 
vgl. [SSS74] vorstellen, siehe auch [FvDFH90] und [BG89]. In Abschnitt 2.4.2 
werden wir das Clippen bzgl. allgemeiner Polygone beschreiben. 


Prinzipiell gibt es für das Clippen neben der Möglichkeit einer analytischen Be- 
rechnung der Schnittpunkte des zu clippenden Objektes mit dem Olip-Polygon 
oder dem Clip-Fenster die Möglichkeit des Clippens während der Bildschirm- 
darstellung des Objektes. In diesem Fall wird für jedes zu setzende Pixel un- 
tersucht, ob es innerhalb des Clip-Polygon liegt. Dies ist aber nur dann für die 
Praxis interessant, wenn die analytische Schnittpunktberechnung aufwendig ist, 
weil z.B. das verwendete Graphiksystem keine Floating-Point-Arithmetik be- 
herrscht, und wenn das zu clippende Objekt so klein ist, daß nur für wenige 
Pixel getestet werden muß, ob sie innerhalb des Clip-Polygons liegen. Wir ge- 
hen hier auf diese Variante nicht näher ein und verweisen auf [FvDFH90] für 
eine ausführlichere Behandlung. Die folgenden Betrachtungen beziehen sich auf 
die analytische Behandlung des Clip-Problems. 


Wir betrachten das Clippen eines Geradensegmentes s mit den Endpunkten Pı 
und P, bzgl. eines rechteckigen Fensters. Die Parameterdarstellung von s ist s = 
Pı +t{P, - P,),O<t<1. Die Eckpunkte des Fensters seien A = (£min: Ymin); 
B = (£mazı Ymin); © = (Lmazı Ymaz) und D = (zmin, Ymaz), vgl. Abbildung 2.34. 
Der Endpunkt P; = (z,,y;), © = 1,2, liegt innerhalb des Fensters, wenn zmin < 
Li < Imar Und Ymin < Yi < Ymaz: Wenn beide Endpunkte von s innerhalb 
des Fensters liegen, liegt s ganz innerhalb des Fensters. Wenn nur einer der 
beiden Endpunkte innerhalb des Fensters liegt, muß zur genauen Bestimmung 
des innerhalb des Fensters liegenden Teils der Schnittpunkt mit dem Fenster 
berechnet werden. Wenn beide Endpunkte von s außerhalb des Fensters liegen, 
kann ein Teil von s innerhalb des Fensters liegen. Auch in diesem Fall müssen die 
Schnittpunkte mit dem Fenster berechnet werden. Die einfachste Methode dafür 
besteht darin, die Schnittpunkte mit allen Fensterkanten zu berechnen. Dazu 
berechnet man für jede Fensterkante f zuerst den Schnittpunkt der Geraden, 
auf der s liegt, mit der Geraden, auf der f liegt, und bestimmt danach durch 
zwei Vergleiche der zugehörigen Parameterwerte, ob der Schnittpunkt wirklich 
auf s und f liegt. Wenn dies der Fall ist, ist ein Schnittpunkt von s mit dem 
Clip-Fenster gefunden. Die Parameterdarstellung der Geraden g, auf der s 
liegt, stg= PR + t(P —_ Pı), —-0oo <t < oo. Wenn die Fensterkante ebenfalls 
durch eine Parametergleichung e = Qı + u(Qa — Qı) gegeben ist, wobei Qı und 
Q. Ecken des Clip-Fensters sind, ist die Parameterdarstellung der Geraden, auf 
der e liegt, f = Qı + u(Q: _ Qı) für -oo <u< oo. Den Schnittpunkt der 
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Abbildung 2.34: Unterteilung der Fensterebene 
in neun Bereiche. Die Bereiche oberhalb des Fen- 
sters enthalten alle Punkte (z,y) mit y > Ymaz- 
Für diese Bereiche ist Bit 3 gesetzt. Die Tabelle 
zeigt, wie die Bits für die anderen Bereiche gesetzt 
werden. 





beiden Geraden bestimmt man durch Gleichsetzen der beiden Gleichungen: 
Pı +t(P - Pı) = Qı + u(Q2 - Qı) 


In die x- und die y-Komponenten zerlegt, hat man damit zwei Gleichungen, 
aus denen die beiden Unbekannten t und u bestimmt werden können. Der 
errechnete Schnittpunkt liegt auf dem Geradensegment, wenn O<t<1. Der 
errechnete Schnittpunkt liegt auf der Fensterkante, wenn 0O<u<i[l. 


Wenn nur ein Endpunkt von s innerhalb des Clip-Fensters liegt, kann die 
Berechnung abgebrochen werden, sobald der erste Schnittpunkt gefunden ist. 
Wenn beide Endpunkte außerhalb liegen, muß man warten, bis zwei Schnitt- 
punkte gefunden sind. Wir werden jetzt den Algorithmus von Cohen und 
Sutherland vorstellen, vgl. [SSS74], der versucht, die Anzahl der Schnittpunkt- 
berechnungen zu verringern. Dies ist deshalb von besonderem Interesse, weil 
man üblicherweise sehr viele Geradensegmente bzgl. des gegebenen Fensters 
clippen will und die Schnittpunktberechnung jedes Segmentes mit den vier Fen- 
sterkanten recht aufwendig ist. 


2.4.1 Der Algorithmus von Cohen und Sutherland 


Der Algorithmus von Cohen und Sutherland versucht, die Schnittpunktbe- 
rechnung zwischen dem Geradensegment s und dem Ülip-Fenster durch Be- 
reichsüberprüfungen wann immer möglich zu vermeiden. Wie bereits erwähnt, 
kann s das Fenster schneiden, wenn beide Endpunkte außerhalb des Fen- 
sters liegen. Wenn aber zusätzlich beide Endpunkte links des Fensters liegen, 
kann kein Schnittpunkt existieren. Das gleiche gilt, wenn beide Endpunkte 
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rechts, unterhalb oder oberhalb des Fensters liegen. Zur Realisierung der Be- 
reichsüberprüfungen unterteilt der Algorithmus die Ebene, die das Clip-Fenster 
enthält, in neun Bereiche, vgl. Abbildung 2.34, und ordnet jedem Bereich eine 
4-Bit-Zahl zu, die angibt, wo der Bereich bzgl. des Fensters liegt. Bit 3 - 
das ist das linkeste Bit - ist gesetzt für Bereiche, die oberhalb des Fensters 
liegen. Bit 2 ist gesetzt für Bereiche, die unterhalb des Fensters liegen. Bit 
1 ist gesetzt für Bereiche, die rechts des Fensters liegen. Bit 0 ist gesetzt für 
Bereiche, die links des Fensters liegen. Die 4-Bit-Zahlen von horizontal oder 
vertikal benachbarten Bereichen unterscheiden sich in genau einer Bitposition. 
Zur Bestimmung des zu einem beliebigen Punkt (z,y) gehörenden Bereiches 
kann folgende Beobachtung verwendet werden: Bit 3 ist das Vorzeichenbit von 
Ymaz — Y, d.h. das Bit ist gesetzt, wenn Ymaz —y < 0 ist. Bit 2 ist das Vor- 
zeichenbit von y — Ymin, Bit 1 ist das Vorzeichenbit von £mar — £, Bit 0 ist 
das Vorzeichenbit von £ — £min. Damit kann jedem der beiden Endpunkte Pı 
und P, von s ein Bereich und eine 4-Bit-Zahl zugeordnet werden. Mit Hilfe 
der 4-Bit-Zahlen C, und C, von P, und P, kann man bestimmen, ob s ganz 
innerhalb oder ganz außerhalb des Fensters liegt. Wenn C} und Cz beide Null 
sind, d.h. wenn die bitweise Oder-Verknüpfung von Cı und Cz 0000 ergibt, 
liegt s ganz innerhalb des Fensters. Wenn P, und P, ganz auf einer Seite des 
Fensters liegen, haben C, und C;z an den entsprechenden Bitpositionen eine l, 
vgl. Abbildung 2.34. Ob dies für eine der vier Bitpositionen zutrifft, kann man 
für beliebige Seiten des Fensters einfach überprüfen, indem man eine bitweise 
Und-Operation auf C} und C, anwendet. Wenn das Ergebnis ungleich Null 
ist, liegen P} und P, ganz außerhalb einer Seite des Fensters und s kann das 
Fenster nicht schneiden. Wenn man durch die beschriebenen einfachen Tests 
nicht ausschließen kann, daß s ganz innerhalb oder ganz außerhalb des Fen- 
sters liegt, teilt der Algorithmus s mit Hilfe einer der Fenstergeraden in zwei 
Teile und wendet die beschriebenen einfachen Tests auf beide Teile an. Einer 
der beiden Teile liegt mit Sicherheit außerhalb des Fensters, für den anderen 
muß die Unterteilung evtl. mit einer anderen Fenstergeraden wiederholt werden. 
Abbildung 2.35 zeigt ein Beispiel für die Anwendung des Verfahrens. Zur Be- 
stimmung der zur Schnittpunktberechnung verwendeten Fenstergeraden kann 
man die 4-Bit-Zahl C eines der Endpunkte P von s verwenden. Wenn Bit 3 
von ( gesetzt ist, liegt P ganz oberhalb des Fensters und man wählt die obere 
Begrenzungsgerade des Fensters als Schnittgerade. Wenn Bit 2 von Ü gesetzt 
ist, nimmt man die untere, wenn Bit 1 gesetzt ist, die rechte, wenn Bit 0 gesetzt 
ist, die linke Begrenzungsgerade. Wenn kein Bit gesetzt ist, verwendet man den 
anderen Endpunkt zur Auswahl. Eine Programmskizze ist in Abbildung 2.36 
wiedergegeben. 
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Abbildung 2.35: Beispiel für die Arbeitsweise des Algorithmus von Cohen und Suther- 
land. Beide Endpunkte des Segmentes AB liegen unterhalb des Fensters, der im Text 
beschriebene Und-Test ist damit erfüllt und das Segment ist nicht sichtbar. Für das Seg- 
ment CE ist weder der Oder-Test noch der Und-Test erfüllt. Daher wird der Schnittpunkt 
mit der Fenstergeraden z = ca berechnet. Der gefundene Schnittpunkt D teilt CE in 
zwei Teile. Für den Teil CD ist der Und-Test erfüllt, d.h. CD liegt außerhalb des Fen- 
sters. Das gleiche gilt für das Segment DE. Für das Segment FI sind die beiden Tests 
ebenfalls nicht erfüllt. Daher wird ebenfalls der Schnittpunkt mit der Fenstergeraden 
2 = cz berechnet, der gefundene Schnittpunkt ist G. Für den Teil F'G ergibt der zweite 
Test, daß FG außerhalb des Fensters liegt. Für das Segment GI ist keiner der beiden 
Tests erfüllt und das Segment muß wieder unterteilt werden, diesmal in zwei Teile GH 
und AI. Für GH ist der Oder-Test erfüllt, d.h. GH liegt ganz innerhalb des Fensters. 
Für HI ist der Und-Test erfüllt, d.h. HI liegt außerhalb des Fensters. 
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void CS_clip(x1,y1,x2,y2,xmin,xmax,ymin,ymax,value); 
float xi1,y1,x2,y2,xmin,xmax,ymin,ymax; 

int value; 

{ 

int ci1,c2; 
float xs,ys; 

















c1 = code(xi1,y1); 
c2 = code(x2,y2); 
if (c1lc2 == 0x0) 
Draw_Linei(xi1,y1,x2,y2,value); 
else if (ci1&c2 != 0x0) 
return; 
else { 
intersect (xs,ys,x1,y1,x2,y2,xmin,xmax,ymin,ymax); 
if (is_outside(xi1,y1)) 
CS_clip(xs,ys,x2,y2,xmin,xmax,ymin,ymax,value); 
else 
CS_clip(xi,yi,xs,ys,xmin,xmax,ymin,ymax,value); 


Abbildung 2.36: Programmskizze zum Algorithmus von Cohen und Sutherland. 
(x1,y1) und (x2,y2) sind die beiden Endpunkte des zu clippenden Geradensegmentes. 
A = (xmin,ymin), B = (xmax,ymin), C = (xmax,ymax) und D = (xmin,ymax) 
sind die Eckpunkte des Clip-Fensters von links unten beginnend im Gegenuhrzeiger- 
sinn. code(x,y) liefert zu Punkt (x,y) die zugehörige 4-Bit-Zahl nach Abbildung 2.34. 
Draw_Linei(x1,y1,x2,y2,value) zeichnet eine Linie zwischen den Punkten (x1,y1) 
und (x2,y2). intersect(xs,ys,x1,y1,x2,y2,xmin,xmax,ymin,ymax) berechnet in 
(xs,ys) einen Schnittpunkt zwischen dem Geradensegment und einer der Fenstergera- 
den, die anhand der 4-Bit-Zahl der Endpunkte des Geradensegmentes ausgewählt wird. 
is_outside(x1,y1) berechnet, ob der Punkt (x1,y1) bzgl. der selben Fenstergeraden 
außerhalb des Fensters liegt. Eine Verbesserung der Laufzeit der skizzierten Prozedur 
CS_clip kann man erreichen, indem man die Rekursion durch eine Schleife ersetzt, weil 
dann der Verwaltungsaufwand für die rekursiven Aufrufe entfällt. Wir haben hier der 
Übersichtlichkeit wegen auf diese Ersetzung verzichtet. 
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konkaves Polygon 
Abbildung 2.37: Ein konkaves Po- 
Iygon kann durch Überlappung meh- 
rerer rechteckiger Fenster entstehen. 
Die Kanten des entstehenden Po- 
Iygons verlaufen immer waagerecht 
oder senkrecht. 


2.4.2 Clippen bzgl. allgemeinen Polygonen 


Wir betrachten jetzt den allgemeinen Fall, daß anstatt des Clip-Fensters ein 
allgemeines konkaves Clip-Polygon verwendet wird. Konkave Polygone können 
unter anderem bei Systemen entstehen, die das Überlappen mehrerer Fenster 
auf einem Bildschirm erlauben, vgl. Abbildung 2.37. Beispiele für solche Sy- 
steme sind Sunview oder X-Windows. 


Wir nehmen wieder an, daß das zu clippende Geradensegment s mit den End- 
punkten P, und P, durch die Parametergleichung s = P, +PR-Pı), 0O<t<IL€, 
beschrieben wird. Das Clippen von s bzgl. eines allgemeinen Clip-Polygons P 
wird in zwei Schritten ausgeführt, vgl. [BG89]: Im ersten Schritt werden alle 
Schnittpunkte von s mit den Kanten von P bestimmt. Dabei wird das oben 
beschriebene Verfahren der Schnittpunktberechnung zwischen einem Geraden- 
segment und einer Fensterkante verwendet. Jeder Schnittpunkt S; kann durch 
einen Parameterwert t; eindeutig repräsentiert werden: 


S;=P + t;(Pı _ Pı) | 


Die Parameterwerte der gefundenen Schnittpunkte seien in aufsteigender Rei- 
henfolge sortiert, d.h. es ist O0 <tı <---<t„ <1. Die gefundenen n Schnitt- 
punkte unterteilen s in n + 1 Segmente. Im zweiten Schritt wird festgestellt, 
welche dieser Segmente sichtbar sind. Dazu bestimmt man zuerst, ob der End- 
punkt P, von s innerhalb von P liegt. Dies kann dadurch geschehen, daß 
man von Pı ausgehend einen horizontalen Strahl aussendet und die Anzahl der 
Schnittpunkte mit P zählt. Wenn die Anzahl dieser Schnittpunkte ungerade 
ist, liegt Pı innerhalb von P. Bei gerader Anzahl von Schnittpunkten liegt Pı 
außerhalb von P. Man beachte, daß die Anzahl der Schnittpunkte von s mit 
P keine Aussage darüber liefert, ob P| innerhalb oder außerhalb von P liegt, 
weil man nicht weiß, ob P, innerhalb oder außerhalb von P liegt. Es ist aber 
möglich, den von P} ausgehenden und in Richtung P, verlaufenden Strahl zu 
verwenden. Wenn man bei der Schnittpunktberechnung im ersten Schritt nicht 
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Abbildung 2.38: Clippen bzgl. ei- 
nes allgemeinen konkaven Polygons: 
Dargestellt sind zwei Geradenstücke, 
deren Endpunkte entweder beide in- 
nerhalb oder beide außerhalb des 
Clip-Polygons liegen. Die inner- 
halb des Clip-Polygon liegenden Seg- 
mente sind fett dargestellt, die außer- 
halb des Clip-Polygons liegenden Seg- 
mente sind gepunktet. 





nur die Schnittpunkte S;, deren Parameterwerte t; zwischen 0 und 1 liegen, 
sondern alle Schnittpunkte mit Parameterwerten t;, > 0 speichert, kann man 
auch über deren Anzahl, wie oben beschrieben, bestimmen, ob P, innerhalb 
oder außerhalb von P liegt. Wenn P| innerhalb von P liegt, sind die durch die 
Parameterintervalle 


(0,11), (t2,t3), . (ti, t2i+1), _ 


bestimmten Segmente sichtbar. Wenn P, außerhalb von P liegt, sind die durch 
die Parameterintervalle 


(t1,t2), (ta,24),°,(tai-nta)s 


bestimmten Segmente sichtbar, vgl. Abbildung 2.38. 


2.5 Halbtonverfahren 


Auf vielen Bildschirmen und vor allem auf Druckern können nur einige wenige 
Intensitätswerte dargestellt werden. Die in diesem Abschnitt beschriebenen Ver- 
fahren versuchen, für diese Ausgabegeräte die Zahl der darstellbaren Intensitäts- 
werte auf Kosten der Auflösung des wiedergegebenen Bildes zu erhöhen. Die 
Verfahren nutzen die Eigenschaft des menschlichen Auges aus, beim Sehvorgang 
eine räumliche Integration durchzuführen: Wenn man einen kleinen Bildaus- 
schnitt aus einer genügend großen Entfernung betrachtet, ist das Auge nicht in 
der Lage, kleine Details des Bildes zu erkennen. Statt dessen mittelt es die dar- 
gestellten Intensitäten und Farben in dem kleinen Bildausschnitt und erkennt 


2.5. HALBTONVERFAHREN 65 


nur die resultierende Gesamtintensität bzw. -farbe!?. Wir werden in diesem 
Abschnitt drei Verfahren vorstellen, mit denen Farbbilder auf Ausgabegeräten 
mit kleiner Farbpalette dargestellt werden können: die Halbton-Simulation, das 
Dither-Verfahren, das Fehlerverteilungsverfahren von Floyd-Steinberg und das 
Fehlerdiffusionsverfahren von Knuth, vgl. [Uli87], [FvDFH90). 


2.5.1 Halbton-Simulation 


Die Ursprünge des Halbton-Verfahrens liegen in der Druckindustrie, wo es 
z.B. für die Wiedergabe von Schwarz-Weiß-Bildern in Zeitungen verwendet 
wird: In jedem Pixel des dargestellten Bildes wird ein Punkt aus Drucker- 
schwärze gesetzt, der umso größer ist, je dunkler der entsprechende Bildbereich 
dargestellt werden soll. Da die Größe der Punkte kontinuierlich geändert wer- 
den kann, können mit dieser Technik prinzipiell beliebig viele Grautöne darge- 
stellt werden. Dies ist bei der Verwendung der Technik für Bildschirme nicht 
möglich, weil diese in Pixel diskret gerastert sind, die nur auf eine festgelegte An- 
zahl von Intensitätswerten gesetzt werden können. Man kann aber die Anzahl 
der darstellbaren Intensitätswerte erhöhen, indem man die ım folgenden vor- 
gestellte Technik der Halbton-Simulation anwendet. Die Halbton-Simulation 
ist gut zur Darstellung von Bildern geeignet, deren Auflösung geringer ist als 
die Auflösung des Bildschirms. Wenn die Auflösung des Bildes genauso groß 
wie die Auflösung des Bildschirms ist, geht durch die Anwendung der Halbton- 
Simulation Information verloren. Wir nehmen in diesem Abschnitt an, daß auf 
dem zur Verfügung stehenden Bildschirm nur zwei Intensitätswerte (weiß und 
schwarz) pro Pixel dargestellt werden können. 


Das Verfahren der Halbton-Simulation unterteilt den Bildschirm in kleine recht- 
eckige Bereiche, z.B. Bereiche der Größe 2x2 Pixel. Die ideale Größe dieser Be- 
reiche ergibt sich aus dem Quotienten der Auflösung des Bildschirms und der 
Auflösung des Bildes. Bei Verwendung von Bereichen der Größe m x n können 
mn +1 Intensitätswerte auf dem Bildschirm dadurch dargestellt werden, daß 
unterschiedlich viele Pixel in dem zugehörigen Bereich gesetzt werden, vgl. Ab- 
bildung 2.39. Ein in einem darzustellenden Bild auftretender Intensitätswert 
wird durch den am nächsten liegenden Intensitätswert approximiert, der mit 
einem Bildschirmbereich dargestellt werden kann. Abbildung 2.41 zeigt eine 
Programmskizze des Verfahrens. 


12Djeses Phänomen macht sich auch eine Kunstrichtung der Malerei - der Pointillismus 
- zunutze, deren Vertreter (Seurat, Signac, Bonnard und andere) propagieren, die Farben 
ım Auge des Betrachters anstatt auf der Leinwand zu mischen. Dementsprechend bestehen 
pointillistische Bilder aus vielen kleinen Punkten in den Grundfarben, die durch die räumliche 
Integration des Auges vom Betrachter als Mischfarben erkannt werden. 
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zulna Be Hackoc (13) 


Abbildung 2.39: Bei Verwendung von Bereichen der Größe 2x2 können auf einem Bild- 
schirm, der nur zwei Intensitätsstufen pro Pixel darstellen kann, fünf Intensitätsstufen pro 
Bereich dargestellt werden. Je nach Intensitätsstufe wird eine unterschiedliche Anzahl 
von Pixeln in dem Bereich gesetzt. Eine Möglichkeit der Verteilung der gesetzten Pixel 
ist hier wiedergegeben. Diese Verteilung wird auch durch die danebenstehende Matrix be- 
schrieben, die angibt, in welcher Reihenfolge die Pixel gesetzt werden, wenn die Intensität 
steigt. 


Wenn man bei der Darstellung des gleichen Intensitätswertes die Pixel der Be- 
reiche immer in der gleichen Weise setzt, können störende Muster auf dem 
Bildschirm entstehen. Beispielsweise entstehen bei Verwendung der durch die 


Matrix 
1 3 
4 2 


beschriebenen Verteilung der gesetzten Pixel, vgl. Abbildung 2.39, in Bereichen 
mit konstanter Intensitätsstufe 2 schräge Linien. Bei Verwendung der durch 


(43) 


beschriebenen Verteilung entstehen horizontale Linien. Es gibt keine feste Aus- 
wahl der Verteilung der gesetzten Pixel, die auf keinen Fall Muster erzeugt. Eine 
Möglichkeit zur Vermeidung von Mustern besteht in einer zufälligen Auswahl 
der Verteilung der zu setzenden Pixel für die darzustellende Intensitätsstufe. 
Für Intensitätsstufe 2 gibt es bei Verwendung von Bereichen der Größe 2 x 2 
sechs mögliche Verteilungen. 


Das Verfahren der Halbton-Simulation ist auch für Ausgabegeräte mit mehr 
als zwei darstellbaren Intensitätsstufen pro Pixel anwendbar. Wenn auf dem 
Ausgabegerät z.B. vier Intensitätsstufen pro Pixel darstellbar sind — d.h. es 
stehen zwei Bit pro Pixel im Pufferspeicher zur Verfügung — dann kann man mit 
Bereichen der Größe 2x2 dreizehn Intensitätsstufen darstellen. Eine mögliche 
Verteilung ist in Abbildung 2.40 wiedergegeben. 
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Abbildung 2.40: Mit Bereichen der Größe 2x 2 können 13 Intensitätsstufen dargestellt 
werden, wenn pro Pixel vier Intensitätsstufen 0 bis 3 zur Verfügung stehen. 


Wie bereits erwähnt, ist das Verfahren der Halbton-Simulation gut anwendbar, 
wenn die Auflösung des darzustellenden Bildes geringer ist als die Auflösung 
des Ausgabegerätes. Wenn das darzustellende Bild die gleiche Auflösung hat 
wie das Ausgabegerät, ist ein anderes Verfahren, das im folgenden Abschnitt 
vorgestellte Dither-Verfahren, besser geeignet. 


2.5.2 Dither-Verfahren 


Mit dem Dither-Verfahren können auf Bildschirmen, die nur zwei Intensitäts- 
stufen pro Pixel darstellen können, mehrere Intensitätsstufen auf Kosten der 
Auflösung simuliert werden. !?. Dabei wird angenommen, daß das darzustel- 
lende Bild die gleiche Auflösung wie der Bildschirm hat. 


Beim Dither-Verfahren wird bei der Entscheidung, ob das Pixel (z,y) des 
Bildschirms gesetzt werden soll, neben dem darzustellenden Intensitätswert 
I(z,y) des zugehörigen Bildpixels auch eine (n xn)-Matrix D®) berücksichtigt, 
die auch als Dithermatrir bezeichnet wird. Bei Verwendung einer (n x n)- 
Dithermatrix können n? + 1 Intensitätsstufen simuliert werden. Für jedes 
Bildpixel wird die darzustellende Intensitätsstufe durch Runden zur nächsten 
simulierbaren Intensitätsstufe bestimmt. Die Dithermatrix D®) enthält jede 
Zahl zwischen 0 und n? — 1 genau einmal. Die Dithermatrix D®) hat z.B. das 
folgende Aussehen: 


13E8 gibt auch eine - allerdings wenig genutzte - Variante für Bildschirme mit mehr als 
zwei darstellbaren Intensitätsstufen, vgl. [PN83]. 
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void halftone (picture,rows,cols,xp,yp,pattern) 
float picture[][]; 
int rows,cols,xp,yp,pattern[][][]; 


{ 







int xpic,ypic,xdis,ydis,xpix,ypix,intensity; 









for (ypic=0,ydis=0;ypic<rows;ypic++,ydis+=yp){ 
for (xpic=0,xdis=0;xpic<cols;xpic++,xdis+=xp) { 
for (ypix=0;ypix<yp;ypix++){ 
for (xpix=0;xpix<xp;xpix++){ 
intensity=int_level(xp,yp,picture[lxpic,ypic]) 
if (pixel_on(intensity,xp,yp,xpix,ypix)) 
set_pixel(xdis+xpix,ydis+typix,1); 









Abbildung 2.41: Programmskizze zur Halbton-Simulation. Das zweidimensionale Feld 
picture enthält die Intensitätswerte des darzustellenden Bildes. rows und cols ist die x- 
bzw. y-Auflösung des Bildes und damit auch die Anzahl der in z- bzw. y-Richtung ver- 
wendeten Bereiche. xp und yp ist die Anzahl der in x- bzw. y-Richtung verwendeten Pixel 
pro Bereich. Die Anzahl der darstellbaren Intensitätsstufen ist damit xp-yp+1. pattern 
ist ein dreidimensionales Feld, das zu jeder darstellbaren Intensitätsstufe angibt, welche 
Pixel des zweidimensionalen Bereiches gesetzt werden müssen. Die beiden äußeren Schlei- 
fen laufen parallel über die Zeilen und Spalten des Bildes und der Bereiche des Bildschirms. 
Die Variablen xpic und ypic dienen dazu, über die Spalten und Zeilen des darzustellen- 
den Bildes zu laufen, xdis und ydis werden dazu verwendet, die linkesten, obersten Pixel 
der entsprechenden Bereiche zu adressieren. Die beiden inneren Schleifen laufen über die 
Zeilen und Spalten der einzelnen Bereiche und setzen die Pixel entsprechend der darzu- 
stellenden Intensitätsstufe. Dabei wird mit int_level(xp,yp,picture[xpic,ypic]) 
die mit Bereichen der Größe xpxyp darstellbare, benachbarte Intensitätsstufe bestimmt. 
pixel_on(intensity,xp,yp,xpix,ypix) testet, ob zur Darstellung der Intensitätsstufe 
intensity das Pixel (xpix,ypix) gesetzt werden muß. Das Setzen der einzelnen Pixel 
wird von der set_pixel-Funktion vorgenommen. 
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void dither (picture,rows,cols,n,dither) 
float picture[]]; 
int rows,cols,n,dither[][]; 


{ 








int x,y,i,j,intensity; 










for (y=0; y<rows; y++){ 
for (x=0; x<cols; x++){ 
i=sx/nj=-yAn; 
intensity=int_level(n,n,picture[x,y]); 
if (intensity > dither[i,j]) 
set pixel(x,y,1); 







Abbildung 2.42: Programmskizze zum Dither-Verfahren: picture, rows und cols 
haben die gleiche Bedeutung wie in Abbildung 2.41. n gibt die Größe der Dithermatrix 
an, die im Feld dither abgelegt ist. Für jedes Pixel des Bildes wird mit einer Modulo- 
Operation der zugehörige Eintrag der Dithermatrix bestimmt. Wenn der dort eingetragene 
Wert kleiner ist als die darzustellende Intensitätsstufe intensity, die wieder mit der 
Funktion int_level bestimmt wird, wird Pixel (x,y) des Bildschirms gesetzt. 


(2) _ 0 2 
ve (51) 


Die Zahlen in der Matrix geben an, in welcher Reihenfolge die Pixel gesetzt wer- 
den, wenn die Intensität steigt. Die Dithermatrix wird so oft auf das Bild gelegt, 
daß jedes Pixel von genau einer Kopie der Dithermatrix bedeckt ist. Danach 
wird für jede Pıxelposition bestimmt, ob die Intensitätsstufe des darzustellenden 
Bildpixels größer ıst als der Eintrag der daraufliegenden Dithermatrix. Wenn 
dies der Fall ist, wird das Bildschirmpixel gesetzt, ansonsten wird es nicht ge- 
setzt. Die Einträge ın der Dithermatrix können also als Schwellenwerte für die 
Bildschirmpixel aufgefaßt werden. Abbildung 2.42 zeigt eine Programmskizze. 


Der Unterschied zwischen der Halbton-Sımulation und dem Dither-Verfahren 
ist folgender: Bei Anwendung der Halbton-Simulation auf Bilder, die die gleiche 
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GODcE 





Abbildung 2.43: Dithermatrizen fürn =3,n=4undn=5 


Auflösung haben wie der Bildschirm, müßte für jeden Bereich des Bildes, der ei- 
nem Bereich des Bildschirms entspricht, eine mittlere Intensitätsstufe bestimmt 
werden. Diese stellt man dann mit den Pixeln des Bildschirmbereiches dar. Bei 
dem Dither-Verfahren wird dagegen die Intensität jedes einzelnen Bildpixels 
bei der Berechnung des zugehörigen Bildschirmpixels berücksichtigt. 


Die Dither-Matrix soll so gewählt werden, daß keine Muster auf dem Bild- 
schirm entstehen, wenn Bereiche mit konstanter Intensität dargestellt werden. 
Abbildung 2.43 zeigt mögliche Dithermatrizen fürn =3,n=4undn=5, 
vgl. [BG89]. Als rekursive Berechungsformel für Potenzen von 2 hat 


pen) _ 4Dr) 4Dr) + 2U m) 
 \ 4Dem +3UW 4Dw) + Um 


gute Ergebnisse geliefert, vgl. [Bay73]. Dabei ist U) eine quadratische Matrix 
mit um =1für allel <:,5 <n. Die Matrix für n = 4 aus Abbildung 2.43 
wurde aus D(?) mit Hilfe dieses Verfahrens errechnet. 


Bei Vergrößerung von n bis zu einem gewissen von der Auflösung abhängigen 
Wert!* erhöht sich die Anzahl der dargestellten Graustufen, ohne daß die räumli- 
che Auflösung nennenswert darunter leidet, wie dies bei der Halbton-Simulation 
der Fall war. Für größere Werte von n wird das Bild jedoch verwischt und er- 
scheint unscharf. Üblicherweise werden Dither-Matrizen bis DDP verwendet. 
Das Dither-Verfahren ist vollständig parallelisierbar. 


14Pür Auflösung 1024 x 1024 liegt dieser Wert je nach darzustellendem Bild etwa zwischen 
10 und 16 
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Lauf nach rechts 





Abbildung 2.44: Fehlerverteilung beim Floyd-Steinberg-Verfahren: Bei der in der linken 
Darstellung angegebenen Reihenfolge der Darstellung der Pixel des Bildschirms wird der 
Fehler beim Lauf nach rechts bzw. links wie in den beiden rechten Abbildungen angegeben 
verteilt. 


2.5.3 Fehlerverteilungs-Verfahren 


Das Fehlerverteilungs-Verfahren, vgl. [FS75] ist - anders als die Halbton- 
Simulation und das Dither-Verfahren - auch sehr gut geeignet für Ausga- 
begeräte mit vielen darstellbaren Intensitätsstufen, deren Anzahl man durch 
dieses Verfahren weiter vergrößern kann. Die mit dem Verfahren erzeugten 
Bildschirmdarstellungen sind meist sehr gut, so daß das Verfahren durchaus als 
der Halbton-Simulation und dem Dither-Verfahren überlegen bezeichnet wer- 
den kann. Wir nehmen im folgenden wieder an, daß Bild und Bildschirm gleiche 
Auflösung haben. 


Wenn man die Intensität eines Bildpixels auf dem Bildschirm mit Hilfe der 
nächstliegenden Intensitätsstufe darstellt, macht man einen Fehler, der sich 
aus der Differenz des dargestellten und des darzustellenden Intensitätswertes 
ergibt. Die Idee des Fehlerverteilungs-Verfahren besteht darin, diesen Feh- 
ler auf die benachbarten, noch nicht dargestellten Bildschirmpixel zu verteilen, 
indem man den darzustellenden Intensitätswert der entsprechenden Bildpixel 
verändert. Dadurch wird für die Nachbarpixel die dargestellte Intensitätsstufe 
evtl. verändert. Ein benachbartes Bildschirmpixel erhält einen umso größeren 
Teil des Fehlers, je näher es dem betrachteten Pixel liegt. Die verschiedenen Va- 
rianten des Fehlerverteilungs-Verfahren unterscheiden sich in der Reihenfolge, 
in der die Pixel besucht werden, oder in der Auswahl der Pixel, auf die der 
Fehler verteilt wird. 


Die einfachste Variante verteilt den Fehler nur auf das nächste darzustellende 
Bildschirmpixel. Das Verfahren von Floyd-Steinberg verteilt den Fehler auf 
mehrere Pixel in der Nachbarschaft. Eine Variante des Verfahrens besteht darın, 
den Fehler auf drei benachbarte Pixel zu verteilen, die noch nicht dargestellt 
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wurden, vgl. auch [BG89]. Wenn die Pixel in der in Abbildung 2.44 wieder- 
gegebenen Reihenfolge gesetzt werden, werden beim Lauf nach rechts 3/8 des 
Fehlers auf das dem betrachteten Pixel (z,y) rechts benachbarte Pixel (r+1,y) 
und auf das unter (z,y) liegende Pixel (z,y +1) verteilt. Pixel (e+1,y+1) 
erhält 1/4 des Fehlers. Beim Lauf nach links wird der Fehler analog auf die 
Pixel (x - 1,y), (z,y+1) und (£e - 1,y+ 1) verteilt, siehe Abbildung 2.44. 
Abbildung 2.45 zeigt eine Programmskizze des Verfahrens. In [FS75] wird eine 
Verteilung des Fehlers auf vier benachbarte Pixel vorgeschlagen, wobei beim 
Lauf nach rechts Pixel (x + 1,y) 7/16 des Fehlers erhält, Pixel (£r-1,y+1) 
erhält 3/16, Pixel (z,y + 1) erhält 5/16, Pixel (£+1,y +1) erhält 1/16 des 
Fehlers. 


Das Floyd-Steinberg-Verfahren liefert sehr gute Ergebnisse, hat aber zwei 
Nachteile, vgl. [Knu87]. Erstens ist das Verfahren im Gegensatz zum Dither- 
Verfahren inhärent sequentiell, weil der dargestellte Intensitätswert eines ge- 
setzten Pixels von den Intensitätswerten aller vorher gesetzen Pixel abhängt. 
Zweitens können manchmal “Geisterbilder” auftreten, weil die akkumulierten 
Fehler sich aufstauen können, bis der nächste darstellbare Intensitätswert er- 
reicht ist. Bei der Wiedergabe von Gesichtern können beispielsweise Echos 
der Haarlinien auf der Stirn auftreten. Dieser Effekt kann durch eine Änderung 
der Gewichtsfaktoren oder einer Skalierung der darzustellenden Intensitätswerte 
teilweise gemildert werden.!® 


2.5.4 Fehlerdiffusions-Verfahren 


Das Fehlerdiffusions-Verfahren, vgl. [Knu87], versucht das Fehlerverteilungs- 
Verfahren so zu modifizieren, daß es parallelisierbar ist und daß keine Geister- 
bilder auftreten. Dazu wird wie beim Dither-Verfahren eine (n x n)-Matrix, 
die Diffusionsmatrir M, verwendet, die ebenso wie die Dithermatrix wiederholt 
auf das darzustellende Bild gelegt wird und die Bildschirmpixel in n? Klassen 
einteilt. Pixel (z,y) gehört zu Klasse M[z mod n,y mod n]. Die Pixel werden 
klassenweise berechnet, d.h. zuerst werden die Pıxel von Klasse 0 berechnet, 
dann die Pixel von Klasse 1 usw. Der bei der Darstellung eines Pixels verur- 
sachte Fehler wird auf die benachbarten Pixel verteilt, die noch nicht berechnet 
sind, vgl. Abbildung 2.46. Jedes Pixel (x,y) hat vier rechtwinklig benachbarte 
Pixel (u, v), so daß (u-z)®+(v-y)? = 1, und vier diagonal benachbarte Pixel 
(u,v) mit (u-z)?+(v-y)?=2. Eine Möglichkeit der Gewichtung bei der Ver- 
teilung des Fehlers besteht darin, den rechtwinklig benachbarten Pixeln einen 
doppelten Anteil des Fehlers wie den diagonal benachbarten Pixeln zuzuteilen. 


15 Beispielsweise durch picture[x,y] = 0.1 + 0.8*picture[x,y]. 
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void err distr(picture,rows,cols) 
float picture[][]; 
int rows,cols; 
{ 
float acc_err[rows+1][cols+1] ‚error, intensity; 
int i,j,x,y,done,right_ run; 
=0; y = 0; done = 0; right. run = 1; 
while (!done) { 
intensity = nearest_level(x,y); 
error = picturelx,y] + acc_err[x,y] - intensity; 
set_pixel(x,y,intensity); 
if (right _run){ 
acc_err[x ‚y+ti]l += 0.375 * error; 
acc_err[x+t1,y ] += 0.375 * error; 
acc_err[x+ti1,y+1] += 0.25 * error; 
} else { 
acc_err[x,y+i1 ] += 0.375 * error; 
acc_err[x-1,y ]J += 0.375 * error; 
acc_err[x-1,y+1] += 0.25 * error; 





















} 


done = next pixel(x,y); | 
x = next pixelx(x,y); y = next pixel_y(x,y); 
right. run = next pixel run (x,y); 





Abbildung 2.45: Programmskizze zum Fehlerverteilungs-Verfahren nach Floyd- 
Steinberg: picture enthält die Intensitätswerte des darzustellenden Bildes. rows und 
cols ist die z- bzw. y-Auflösung des Bildes und des Bildschirms. acc_err ist eine 
Matrix, die für jedes Pixel den akkumulierten Fehler aufnimmt und und die mit O0 in- 
itialisiert sei. Man beachte, daß die akkumulierten Fehler hier der Einfachheit halber in 
eine Matrix abgelegt werden, obwohl eine Datenstruktur ausreichen würde, die zwei Bild- 
schirmzeilen umfaßt. intensity dient zur Aufnahme der für das aktuellen Pixel (x,y) 
gewählten Intensitätsstufe, die durch die Funktion nearest_level(x,y) bestimmt wird. 
right_run gibt an, ob das nächste untersuchte Pixel rechts vom aktuellen Pixel liegt oder 
nicht. Das nächste untersuchte Pixel wird von den beiden Funktionen next _pixel_x 
und next_pixel_y bestimmt. next_pixel_ run bestimmt, in welcher Reihenfolge die 
nächsten Pixel untersucht werden. 
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void diffusion (picture,rows,cols,n,matrix) 
float picture[l][]; 

int rows,cols,n,matrix[] U]; 

int x,y,i,j,K,intensity; 

float error; 














for (k=0; k<n#n; k++) { 
for (y=0; y<rows; y++){ 

for (x=0; x<cols; x++){ 
i=sx/\nj=-yAn; 
intensity=int_level(n,n,picture[x,y]); 
error = picture[x,y] - intensity; 
set_ pixel (x,y,intensity); 
distribute_error(x,y,error,matrix[i,j]); 









Abbildung 2.46: Programmskizze zum Diffusions-Verfahren. distribute_error- 
(x,y,error,matrix[i,j]) verteilt den entstandenen Fehler error auf alle zu (x,y) 
benachbarten Pixel, deren Klassennummer größer als die Klassennummer matrix[i,j] 
von (x,y) ist. 
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Abbildung 2.47: Beispiele für Diffusionsmatrizen. Die linke Diffusionsmatrix hat zwei 
Barone (62 und 63) und zwei Fast-Barone (60 und 61). Die rechte Diffusionsmatrix hat 
nur einen Baron und einen Fast-Baron. 


Die Auswahl der Diffusionsmatrix sollte so erfolgen, daß es möglichst wenig Pixel 
gibt, die keinen oder nur einen Nachbarn mit größerer Klassennummer haben. 
In [Knu87] werden Pixel, die keinen Nachbarn mit größerer Klassennummer 
haben, als Barone bezeichnet, Pixel, die nur einen Nachbarn mit größerer Klas- 
sennummer haben, als Fast-Barone. Barone sind unerwünscht, weil der lokale 
Fehler der Pixel nicht verteilt werden kann. Fast-Barone verteilen den Fehler 
nur auf einen Nachbarn. Abbildung 2.47 zeigt zwei Beispiel-Diffusionsmatrizen 
fürn =8. 

Eine weitere Verbesserung der Bildqualität erreicht man durch eine Verstärkung 
der Kanten, vgl. [JJN76] und [JR76]. Das bedeutet, daß die darzustellende 
Intensität I(z,y) von Pixel (z,y) ersetzt wird durch 


I(z,y) — al(z,y) 
l-«a 


I'(z, y) = 


wobei /(z,y) der Mittelwert der Intensitäten von Pixel (z,y) und seinen acht 
Nachbarpixeln ist: 


(2.15) 


c+l y+l 


I(z,y) = ; 2 2 Ir) 


u=r-1v=y- 


Für & > 0 wird der Abstand von /(z,y) von der Intensität der Nachbarpixel 
vergrößert. Für & = 0.9 wird (2.15) zu 


Pay) =9 Kay) - > KKu,v) 
0< Wo w-y)®<3 
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In [Knu87] sind Experimente für die Anwendung der unterschiedlichen Ver- 
fahren beschrieben, die zeigen, daß das Diffusionsverfahren zwar für Bildschir- 
manwendungen dem Fehlerverteilungs-Verfahren geringfügig unterlegen ist, daß 
es aber bei Druckeranwendungen (z.B. einem Standard-Laserdrucker mit 300 
Punkten pro Inch) wesentlich bessere Ergebnisse als das Dither-Verfahren oder 
das Fehlerverteilungs-Verfahren liefert. Der gleiche Artikel beschreibt weitere 
Einzelheiten und Varianten des Diffusionsverfahren, auf die wir hier nicht wei- 
ter eingehen können. Das Diffusionsverfahren ist vollständig parallelisierbar und 
erzeugt nicht die beim Fehlerverteilungs-Verfahren erwähnten Geisterbilder. 


2.6 Verwendung einer Farbtabelle 


In dem in Abschnitt 1.2 eingeführten Modell eines Rastergraphiksystems erzeugt 
ein Raster-Scan-Generator Adressen (x, y) für den Pufferspeicher und greift mit 
diesen auf den Intensitätswert für das zugehörige Pixel zu, vgl. Abbildung 1.3. 


Bei einem Farbbildschirm können an jeder Pixelposition drei Grundfarben (rot, 
grün, blau) dargestellt werden, die beliebig gemischt werden können. Man 
erreicht dies durch Verwendung von drei separaten Elektronenstrahlen. Für 
jede Grundfarbe steht üblicherweise eine Anzahl von Farbschattierungen zur 
Verfügung. Physikalisch werden diese Farbschattierungen durch Variation der 
Spannungen erzeugt, mit denen die zugehörigen Elektronenstrahlen gesteu- 
ert werden. Repräsentiert werden die unterschiedlichen Farbschattierungen 
durch Abspeichern unterschiedlicher Intensitätswerte im Pufferspeicher. Da 
drei Grundfarben verwendet werden, müssen auch drei Intensitätswerte abge- 
speichert werden. Dies hat den Nachteil, daß der Pufferspeicher recht groß wird: 
Bei einer Bildschirm-Auflösung von 1024 x 1024 muß der Pufferspeicher bei 
24 Bit pro Pixel, also 8 Bit pro Grundfarbe, 3 MByte groß sein. Ein weite- 
rer Nachteil besteht darin, daß die Pixeleinträge im Pufferspeicher sehr schnell 
gelesen werden müssen. Um ein Flackern des Bildschirms zu vermeiden, muß 
der Bildschirm mindestens 50 mal pro Sekunde aufgefrischt werden. Für einen 
Bildschirm der Auflösung 1024x1024 bleiben also für einen Zugriff auf einen Pi- 
xeleintrag von 24 Bit höchstens 19 ns. Speicherbausteine mit dieser Zugriffszeit 
sind sehr teuer. 


Man braucht für eine Bildschirmdarstellung mit der Auflösung 1024x1024 (also 
etwa eine Million Pixel) keine 16 Millionen Farbwerte, weil die Darstellung gar 
nicht so viele Pixel hat. Für eine realistische Darstellung von Bildern ist trotz- 
dem eine feine Abstufung der Farbschattierungen erforderlich, weil sonst kon- 
tinuierliche Farbübergänge nur schlecht dargestellt werden können. Hier bietet 
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Abbildung 2.48: Rastergraphiksystem mit Farbtabelle: Die im Pufferspeicher abgelegten 
Werte sind Adressen in die Farbtabelle, die bei 8-Bit-Adressen 256 Einträge haben kann. 
Wenn man pro Grundfarbe 256 Farbschattierungen verwendet, erhält die Farbtabelle 24- 
Bit-Einträge, von denen je 8 Bit zur Steuerung der Intensität der drei Elektronenstrahlen 
für die drei Grundfarben verwendet werden. 


sich der Einsatz einer Farbtabelle (look-up table, LUT) an: Die im Pufferspei- 
cher abgelegten Werte geben nicht direkt die Intensitätswerte der Grundfarben 
an, sondern dienen als Index in die Farbtabelle, in der die eigentlichen Inten- 
sitätswerte abgelegt sind, vgl. Abbildung 2.48. Für kleinere, nicht speziell für 
die Graphikausgabe hergestellte Systeme werden oft Farbtabellen der Größe 
256 verwendet. In diesem Fall braucht im Pufferspeicher für jedes Pixel nur ein 
8-Bit-Index abgelegt zu werden. Die 24-Bit-Farbwerte sind in der Farbtabelle 
abgespeichert. Damit stehen dann für die Darstellung eines Bildes 256 Misch- 
farben zur Verfügung, die man aus 16 Millionen Mischfarben auswählen kann, 
indem man die Farbtabelle ensprechend besetzt. Die Größe des Pufferspeichers 
wird dadurch auf ein Drittel reduziert. Die meisten der heute verwendeten 
Grafiksysteme arbeiten mit einer Farbtabelle. 


Wir werden uns im folgenden zunächst mit der Frage beschäftigen, welche Farb- 
schattierungen man am besten für die Grundfarben auswählt, vgl. [FvDFH90]. 
Obwohl diese Auswahl nicht per Programm gesteuert werden kann, sondern von 
der Hardware vorgegeben ist, ist es für die Besetzung der Farbtabelle oft nütz- 
lich zu wissen, wie die Auswahl der Farbschattierungen üblicherweise getroffen 
wird. Danach werden wir uns der Frage zuwenden, wie die Farbtabelle für ein 
gegebenes Bild am besten zu besetzen ist, damit eine möglichst realistische Wie- 
dergabe erreicht wird, vgl. auch [BG89]. Die Besetzung der Farbtabelle kann 


vom Programmierer geändert werden. 
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2.6.1 Auswahl der Farbschattierungen 


Für jede der Grundfarben rot, grün und blau soll eine Menge von Farbschat- 
tierungen zur Verfügung gestellt werden. Oft sind dies 256, so viele, wie mit 
8 Bit repräsentiert werden können. Jede Farbschattierung entspricht einem 
Intensitätswert zwischen 0 und 1, der angibt, mit welchem Prozentsatz der Ma- 
ximalspannung der zugehörige Elektronenstrahl angesteuert wird. Wir werden 
uns in diesem Abschnitt mit der Frage beschäftigen, welche Farbschattierungen 
zur Verfügung gestellt werden sollen, d.h. welche 256 Intensitätswerte zwischen 
0 und 1 verwendet werden sollen. Die einfachste Möglichkeit besteht in ei- 
ner gleichmäßigen Verteilung der Intensitätswerte zwischen 0 und 1. Dies 
läßt jedoch die Eigenschaft des menschlichen Auges außer Acht, nicht abso- 
lute, sondern relative Intensitäten wahrzunehmen. Beim Betrachten von zwei 
Farbschattierungen unterschiedlicher Intensität wird nicht deren absoluten In- 
tensitätswert, sondern nur der relative Unterschied zwischen den Intensitätswer- 
ten erkannt. Die beiden Farbschattierungen der Intensität 0.1 und 0.11 scheinen 
die gleiche Intensitätsdifferenz zu haben wie die beiden Farbschattierungen der 
Intensität 0.5 und 0.55. Deshalb sollte man die Intensitätsstufen nicht linear 
sondern logarithmisch verteilen. 


Sei Io die kleinste auf dem verwendeten Bildschirm darstellbare Intensität!®, 
die maximal darstellbare Intensität /naz sei l. Wir wählen von Io ausgehend 
n+ 1 Intensitätsstufen, wobei zwei benachbarte Intensitätsstufen sich um einen 
Faktor r unterscheiden, wie folgt: 


Io = Io 

I, = rIo 

I; = rI, = r-Io 
I = r"obo=1 


Daraus erhält man für r den Wert 
1 1/n 
+ 


el (2.16) 


167, hat für die üblicherweise verwendeten Bildschirme Werte zwischen 0.005 und 0.025. 


und es gilt wegen I; =r’I, 
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Fürn =3 und /Io = 1/8 erhält man z.B. r = 2 und die Intensitätsstufen 1/8, 
1/4, 1/2, 1. Für n = 255 und Io = 0.02 erhält man die Intensitätsstufen 0.02, 
0.0203, 0.0206, 0.0209, 0.0213, -- -, 0.9848, 1. 


Die Darstellung der ausgewählten Intensitätsstufen auf dem Bildschirm ist we- 
gen der Nichtlinearität bei der Bildschirmdarstellung ein Problem. Der Haupt- 
grund für die Nichtlinearität liegt in der Verwendung von Phosphor für die 
Bildschirmröhren. Die von einem Phosphor-Bildschirm ausgestrahlte Inten- 
sität ] hängt von der Anzahl N der mit dem Blektronenstrahl auftreffenden 
Elektronen ab: 


I=kN? (2.17) 


Dabei sind Y und k von dem verwendeten Bildschirm abhängige Konstanten, 
die üblicherweise durch Experimente bestimmt werden. Der Wert für x liegt für 
die meisten Bildschirme zwischen 2 und 3, vgl. [Hal89]. N ist proportional zur 
angelegten Spannung, d.h. zum angesteuerten Intensitätswert V. Man erhält 
deswegen für eine andere Konstante c: 


I=cV’? 


1/y 
V= (2) 
Cc 


Diesen Intensitätswert muß man anlegen, um auf dem Bildschirm die Intensität 
I darzustellen. Für jede der Grundfarben sollen 256 Farbschattierungen zur 
Verfügung gestellt werden, die durch die Formel 2.16 bestimmt werden. Um die 
Intensität I; auf dem Bildschirm zu erzeugen, muß man für die Pixelintensität 


den Wert 


Für V erhält man also: 


spezifizieren. Die mit dieser Formel beschriebene Anpassung der Pixelinten- 
sität an die Bildschirmintensität wird auch als Gamma-Korrektur bezeichnet, 
benannt nach der in Formel (2.17) verwendeten Konstanten. Wenn keine Farb- 
tabelle verwendet wird, wird 5 in dem Teil des Pixeleintrages im Pufferspeicher 
für die entsprechende Grundfarbe abgelegt. Bei Verwendung einer Farbtabelle 
steht 7 im entsprechenden Eintrag der Farbtabelle. Eine Dekodierung sorgt 
in beiden Fällen für die Ansteuerung des Bildschirms mit dem zugehörigen 
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Abbildung 2.49: Eine Dekodierung spaltet den 24-Bit-Wert aus der Farbtabelle LUT in 
drei Teile mit je 8 Bit. Jeder dieser drei 8-Bit-Werte dient zum Ansteuern einer Tabelle, 
in der zu jeder Intensität der zugehörige Spannungswert abgelegt ist. 


Spannungswert, siehe Abbildung 2.49. Gute (aber auch teurere) Bildschirme 
haben eine logarithmische Aufteilung der Intensitätsstufen und berücksichtigen 
die Gamma-Korrektur. Bei einfacheren Systemen muß man die Einträge in der 
Farbtabelle entsprechend modifizieren. 


2.6.2 Besetzung der Farbtabelle 


In die Farbtabelle werden die Mischfarben eingetragen, die für die Darstellung 
eines Bildes zur Verfügung stehen. Jede Mischfarbe wird durch Angabe ei- 
ner Intensitätsstufe für jede der drei Grundfarben beschrieben. Üblicherweise 
können pro Grundfarbe 256 Intensitätsstufen spezifiziert werden. Damit kann 
eine Mischfarbe durch einen 24-Bit-Wert beschrieben werden, der ın der Farbta- 
belle abgespeichert wird. Jeder Eintrag des Pufferspeichers enthält eine Adresse 
für die Farbtabelle. Es stellt sich die Frage, wie die Farbtabelle besetzt wer- 
den soll, so daß die Mischfarben des darzustellenden Bildes durch die in der 
Farbtabelle abgelegten Mischfarben möglichst gut angenähert werden. Die im 
folgenden vorgestellten Verfahren, vgl. [Hec82], [BG89], versuchen, die Farb- 
tabelle entsprechend zu besetzen. Bis auf das erste Verfahren, die uniforme 
Quantisierung, besetzen alle Verfahren die Farbtabelle speziell für die Darstel- 
lung eines Bildes. Wenn ein anderes Bild dargestellt werden soll, muß die 
Farbtabelle neu belegt werden. 
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Abbildung 2.50: Anwendung der 


BHEHEEEEE uniformen Quantisierung auf 8-Bit- 


ln nn Adressen: Für die Grundfarben rot 

rot grün blau | und grün werden je drei Bit verwen- 

3Bit 3Bit 2Bit det, für blau werden zwei Bit verwen- 
det. 


2.6.2.1 Uniforme Quantisierung 


Das Verfahren der uniformen Quantisierung teilt die Adressen für die Farb- 
tabelle in drei Teile auf. Jeder Teil wird für eine Grundfarbe benutzt. Bei 
Verwendung von 8-Bit-Adressen benutzt man üblicherweise für rot und grün 
drei Bits, für blau zwei Bits, vgl. Abbildung 2.50. Damit können für rot und 
grün acht verschiedene Farbschattierungen aus 256 möglichen in die Farbtabelle 
eingetragen werden, für blau vier. Für eine Grundfarbe werden in die Farbta- 
belle Farbschattierungen eingetragen, die gleichmäßig über die darstellbaren 
Farbschattierungen verteilt sind. Damit wird eine gleichmäßige Abdeckung der 
Farbschattierungen erreicht. Eine Farbschattierung des Bildes wird durch die 
nächstliegende in die Farbtabelle eingetragene Farbschattierung dargestellt. 


Die uniforme Quantisierung ist unabhängig vom darzustellenden Bild, die Farb- 
tabelle braucht also bei der Darstellung eines neuen Bildes nicht neu besetzt 
zu werden. Dementsprechend sind aber auch je nach der Farbverteilung des 
vorliegenden Bildes sichtbare Sprünge in der Farbabstufung der erzeugten Dar- 
stellung erkennbar. Die uniforme Quantisierung wird typischerweise als Stan- 
dardbelegung der Farbtabelle verwendet, die gut geeignet ist, wenn auf dem 
Bildschirm nur wenige Farben dargestellt werden müssen. Dies ist z.B. für gra- 
phische Benutzeroberflächen der Fall. Bei der Darstellung von Farbbildern ist 
die Standardbelegung meist nur für den Einsatz in einem Previewer geeignet, 
mit dem man sich einen ersten Eindruck vom Aussehen eines Bildes verschaffen 
kann. Für die Erzeugung der endgültigen Darstellung muß meist eines der in 
den nächsten Abschnitten beschriebenen, aufwendigeren Verfahren angewendet 
werden. 


2.6.2.2 Popularitätsalgorithmus 


Das als Popularitätsalgorithmus bekannte Verfahren bestimmt die 256 häufig- 
sten Farbwerte des darzustellenden Bildes und besetzt die Farbtabelle mit genau 
diesen Farbwerten. Zu einem in dem darzustellenden Bild auftretenden Farb- 
wert wird für die Darstellung auf dem Bildschirm der nächstliegende Farbwert 
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aus der Farbtabelle verwendet. Zur Bestimmung des nächstliegenden Farb- 
wertes kann der kartesische Abstand im RGB-Raum verwendet werden: Ein 
Farbwert wird durch einen Intensitätswert zwischen 0 und 1 für jede der drei 
Grundfarben dargestellt. Man kann diese Intensitätswerte als Koordinaten- 
werte in einem rechtwinkligen RGB-Koordinatensystem auffassen, dessen Ach- 
sen den Grundfarben rot, grün und blau entsprechen, vgl. Abbildung 2.51. Jede 
aus den Grundfarben zusammengesetzte Mischfarbe kann somit als Punkt im 
RGB-Raum aufgefaßt werden. Sei P} = (Rı,Gı1,Bı) der zu einer Mischfarbe 
Mı des Bildes gehörende Punkt im RGB-Raum, P, = (R.,G2, Ba) sei der zu 
einer Mischfarbe M; der Farbtabelle gehörende Punkt. Der kartesische Abstand 
zwischen P, und P, ist definiert als: 


dı(Pı,P:) =yV(R -R)+(Gı-G)+(Bı - B,)? 


Zur Bestimmung des M}, an nächsten liegenden Farbwertes M, der Farbtabelle 
suchen wir P, so, daß dı(Pı, P:) minimiert wird. Die rechenzeitaufwendige 
Wurzelbildung kann man vermeiden, wenn man statt dem kartesischen Abstand 
den Manhattan-Abstand im RGB-Raum verwendet. Der Manhattan-Abstand 
zwischen P} und P, ist definiert als: 


dm(Pı, Ps) = |Rı - Re| + |Gı - Ga] + |Bı - Ba] 


Man beachte, daß die beschriebene Minimumsuche für jeden Bildpunkt durch- 
geführt werden muß. Wenn die Einträge der Farbtabelle nicht geordnet sind, 
muß für eine Minimumsuche jeder Eintrag der Farbtabelle untersucht werden. 
Das Verfahren ist also relativ aufwendig: Bei einer Bildschirmauflösung von 
1024x1024 und einer Farbtabelle der Größe 256 müssen etwa 256 Millionen 
Abstände. bestimmt werden! Man beachte, daß auch eine Sortierung der Farb- 
tabelleneinträge z.B. nach einer der Grundfarben nicht die Notwendigkeit be- 
hebt, alle Einträge der Farbtabelle zu untersuchen. Der Grund dafür liegt darin, 
daß der Farbtabelleneintrag, der bzgl. der Sortierungskomponente den kleinsten 
Abstand von der Mischfarbe des Bildes hat, nicht unbedingt der Farbtabellen- 
eintrag mit dem kleinsten Abstand sein muß. Auch eine lexikalische Sortierung 


schafft keine Abhilfe. 


Eine Reduzierung der Laufzeit kann man erreichen, indem man sich zu jeder 
Mischfarbe des Bildes die zugehörige Mischfarbe der Farbtabelle merkt, nach- 
dem man diese durch die beschriebene Minimumsuche bestimmt hat. Realisie- 
ren läßt sich dies durch Verwendung einer Tabelle, die so viele Einträge hat, 
wie das Bild verschiedene Farbwerte. Sobald für einen Farbwert der nächstlie- 
gende Farbtabelleneintrag gefunden ist, wird dieser in die Tabelle eingetragen. 
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Abbildung 2.51: Veranschaulichung des 
RGB-Koordinatensystems: Da alle zu ei- 
ner Grundfarbe gehörenden Intensitätswerte 
zwischen 0 und 1 liegen, liegt der zu ei- 
ner Mischfarbe gehörende RGB-Punkt in 
einem Einheitswürfel, dessen Eckpunkte in 
den Punkten (0,0,0) und (1,1,1) liegen. 





Bei der Suche nach dem nächstliegenden Farbtabelleneintrag für einen Farb- 
wert schaut man zuerst ın der Tabelle nach, ob dort bereits ein Farbwert aus 
der Farbtabelle eingetragen ist. Wenn dies der Fall ist, braucht die aufwendige 
Minimumsuche nicht mehr durchgeführt zu werden. Der Vorteil liegt darin, daß 
für jeden Farbwert des Bildes nur eine Suche nach dem nächstliegenden Eintrag 
der Farbtabelle ausgeführt werden muß. Oft ist es so, daß das darzustellende 
Bild viele Farbwerte mehr als einmal enthält. In diesem Fall kann man die Lauf- 
zeit mit Hilfe der beschriebenen Tabelle z.T. erheblich reduzieren. Die Tabelle 
wird nur dann sehr groß, wenn das darzustellende Bild viele unterschiedliche 
Farbwerte enthält. 


Der Popularitätsalgorithmus nimmt die 256 häufigsten Farbwerte des Bildes in 
die Farbtabelle auf. Alle anderen Farbwerte des Bildes spielen für die Besetzung 
der Farbtabelle keine Rolle. Sie werden durch den nächstliegenden Eintrag der 
Farbtabelle auf dem Bildschirm dargestellt. Dies hat den Nachteil, daß wichtige 
Details, die nur einen kleinen Bildbereich ausfüllen, farblich evtl. völlig falsch 
dargestellt werden, weil keiner der Farbtabelleneinträge dem darzustellenden 
Farbwert nahekommt. 


2.6.2.3 Median-Schnitt-Algorithmus 


Der Median-Schnitt-Algorithmus hat das Ziel, daß jeder Farbtabelleneintrag 
gleich viele Pixel des Bildes repräsentieren soll. Dies erreicht der Algorithmus 
durch eine Unterteilung des RGB-Würfels in Teilvolumen (Quader), wobei die 
Unterteilung immer parallel zu den Koordinatenachsen erfolgt. Jedem Pixel des 
Bildes wird ein Punkt im RGB-Würfel zugeordnet, der den Farbwert des Pixels 
repräsentiert. Zu Beginn sucht der Algorithmus den kleinsten Teilquader des 
Einheitswürfel, in dem alle Pixel des Bildes enthalten sind. Dann wird dieser 
Quader entlang der längsten Kante so unterteilt, daß in beiden Hälften etwa 
gleich viele Pixel enthalten sind. Diese Form der Unterteilung wird auch als 
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Median-Schnitt bezeichnet. Die beiden durch den Schnitt entstandenen Qua- 
der werden auf ihre Extremkoordinaten kontrahiert, d.h. man sucht wieder die 
kleinsten Teilquader, die noch alle Pıxel enthalten. Auf die so entstandenen Teil- 
quader wird dann der Algorithmus rekursiv angewendet. Der Algorithmus läuft 
so lange, bis 256 Quader erzeugt sind, oder bis keine Quader mehr geteilt wer- 
den können. Danach wird für jeden Quader eine Mischfarbe durch gewichtete 
Mittelwertbildung über die Farbwerte der Pixel in dem Quader berechnet. Der 
so erhaltene Farbwert wird in der Farbtabelle eingetragen. Für die Darstellung 
auf dem Bildschirm erhält jedes Pixel den Farbwert des Quaders, in dem es liegt. 
Eine Programmskizze ist in Abbildung 2.52 wiedergegeben. Die beschriebene 
rekursive Unterteilung der Quader kann mit Hilfe eines binären Baumes recht 
gut beschrieben werden, der auch als BSP-Baum bezeichnet wird (für binary 
space partitioning), weil er durch Unterteilung der beschriebenen Raumbereiche 
in je zwei Teile entsteht. BSP-Bäume werden auch bei den Raumunterteilungs- 
verfahren verwendet, die zur Optimierung des Ray-Tracing-Verfahrens benutzt 
werden, vgl. Abschnitt 8.6. Zu einem Farbwert F des Bildes kann der zu- 
gehörige Farbwert der Farbtabelle durch einen von der Wurzel zu den Blättern 
fortschreitenden Lauf über den BSP-Baum bestimmt werden, wobei auf jeder 
Stufe festgestellt wird, auf welcher Seite der Unterteilungsebene der Farbwert 
F liegt. Diese Suche endet in dem Blatt, das den Quader repräsentiert, der F 
enthält. 

Der Median-Schnitt-Algorithmus liefert in der Praxis sehr gute Ergebnisse. Dies geht 
allerdings auf Kosten einer hohen Laufzeit und vor allem eines hohen Speicherplatzbe- 
darfs: Für jeden Quader müssen alle enthaltenen Pixelpunkte abgespeichert werden. 
In den Knoten des BSP-Baumes werden also insgesamt so viele Pixelpunkte gehal- 
ten wie das darzustellende Bild Pixel hat. Jeder Pixelpunkt wird mit drei Werten 
dargestellt, die den Intensitätswerten für die drei Grundfarben entsprechen. Wenn 
256 Farbschattierungen pro Grundfarbe zur Verfügung stehen, braucht man somit 
zum Abspeichern eines Pixelpunktes 24 Bit. Für ein Bild der Auflösung 1024x 1024 
braucht man z.B. allein für die Ablage der Pixelpunkte 3MByte Speicher. Man kann 
den Platzbedarf reduzieren, indem man alle Bildpixel mit gleichem Farbwert durch 
einen einzigen Eintrag ersetzt, der zusätzlich einen Zähler enthält. 


Eine weitere Verbesserung der Bildqualität erhält man durch nachträgliche Anwen- 
dung des Floyd-Steinberg-Algorithmus aus Abschnitt 2.5.3. Jedem Pixel des Bildes 
ist nach Anwendung des Median-Schnitt-Algorithmus ein bestimmter Farbtabellen- 
eintrag zugeordnet. Dieser ist nicht unbedingt mit dem ursprünglichen Farbwert des 
Bildpixels identisch, sondern weicht von diesem um einen bestimmten Betrag ab. 
Diesen Abweich-Fehler verteilt man mit Floyd-Steinberg auf die Nachbarpixel. 


Der Unterschied zwischen dem Median-Schnitt-Algorithmus und dem Popularitäts- 
Algorithmus liegt darin, daß beim Popularitäts-Algorithmus nur die 256 häufigsten 
Farbwerte berücksichtigt werden. Wenn diese alle Schattierungen von rot sind, wer- 
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long int *median cut (picture,n) 
long int picture[] [)] ,n; 

{ 

long int look. up_table[n], color; 
struct bsp_node *root, *b, *l; 
















root = build root(picture); 
shrink(root); 


do { 
b = search max_leaf (root); 
split(b); 


shrink(b->1lson); shrink(b->rson); 
} while ((number_of_leaves(root) < n) && 
splittable_leaf_exists(root)) 
for (l1=first_leaf(root); 1!=NULL; l=next_leaf(1)) do {f 
color = compute_average(l); 
insert(color,look up_table); 


} 


return look up_table; 


} 


Abbildung 2.52: Programmskizze zum Median-Schnitt-Algorithmus: picture enthält 
die Intensitätswerte des darzustellenden Bildes als 24-Bit-Werte. n ist die Größe der 
zu besetzenden Farbtabelle 1ook_up_table, die als Resultat von der Funktion zurück- 
geliefert wird. Der Aufteilungsprozeß wird durch einen binären Baum dargestellt, dessen 
Knoten Quader repräsentieren. bsp_node sei eine Datenstruktur für die Knoten, die ne- 
ben den Verweisen lson und rson auf den linken und rechten Sohn auch die zu dem 
dargestellten Quader gehörenden Pixelpunkte im RGB-Raum sowie die Ausdehnung des 
Quaders enthält. build_root (picture) baut die Wurzel des Baumes für das vorlie- 
gende Bild auf, shrink(root) schrumpft den repräsentierten Quader gerade so weit, 
daß noch alle Pixelpunkte enthalten sind. search max_leaf(root) sucht den Blatt- 
knoten mit den meisten Pixelpunkten. split(b) teilt diesen Blattknoten entlang der 
längsten Kante so, daß die beiden entstehenden Teilquader etwa gleich viele Pixelpunkte 
enthalten. Das Aufteilen wird im Baum dadurch dargestellt, daß der entsprechende Blatt- 
knoten zwei neue Kinder erhält, deren Ausdehnung sich aus der gewählten Aufteilung 
ergibt. number_of_leaves(root) bestimmt die Anzahl der Blattknoten des Baumes, 
splittable_leaf_exists(root) bestimmt, ob einer der Blattknoten noch mehr als 
einen Pixelpunkt enthält. first_leaf(root) bestimmt das erste Blatt des Baumes, 
next_leaf(1) bestimmt zum Blatt 1 das nächste Blatt. compute_average(1) be- 
stimmt für das Blatt 1 das geometrische Mittel aller zugehörigen Pixelpunkte, dargestellt 
als 24-Bit-Wert. insert(color,look up_table) fügt den bestimmten Wert in die 
Farbtabelle ein. 
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den z.B. Grüntöne gar nicht in die Farbtabelle aufgenommen und auf dem Bildschirm 
durch Rotschattierungen dargestellt. Beim Median-Schnitt-Algorithmus wird da- 
gegen jeder auftretende Farbwert — entsprechend seinem Vorkommen gewichtet - 
berücksichtigt. 


2.6.2.4 Octree-Quantisierung 


Das Verfahren der Octree-Quantisierung arbeitet ähnlich wie der Median-Schnitt- 
Algorithmus, hat aber eine geringere Laufzeit. Im Unterschied zum Median-Schnitt- 
Algorithmus benutzt das Verfahren der Octree-Quantisierung eine regelmäßige Un- 
terteilung des RGB-Würfels in acht gleichgroße Unterwürfel, die auch als Octree- 
Zerlegung bezeichnet wird. Die Wurzel des Octree ist der gesamte RGB-Würfel mit 
den Begrenzungsebenen R=0,R=1,G0G=0,G=1,B=0,B=1. Die acht Kin- 
der der Wurzel erhält man durch Schnittbildung des Wurzelwürfels mit den Ebenen 
R = 1/2, G = 1/2,B = 1/2. Jeder dieser Kindknoten ist wieder ein Würfel, der 
eine Anzahl von Pixelpunkten enthält. Die Unterteilung wird rekursiv weitergeführt, 
bis jeder Teilwürfel nur noch einen Pixelpunkt enthält. Bei jeder Unterteilung erhält 
der unterteilte Würfel acht gleichgroße Kindknoten im Octree. Nach Aufbau des 
vollständigen Octrees wird dieser von den Blättern her reduziert. Ein Reduktions- 
schritt löscht acht verschwisterte Blätter und speichert dabei in Vaterknoten den 
Mittelwert der in den Blättern enthaltenen Pixelpunkte. Zur Reduktion werden die 
verschwisterten Blätter ausgewählt, die zusammen die wenigsten Pixel enthalten. Die 
Reduktion stoppt, wenn der Octree genau 256 Blätter hat. Die errechneten Mittel- 
werte der Blätter des Octrees werden in die Farbtabelle eingetragen. Um den zu 
einem in dem darzustellenden Bild enthaltenen Farbwert gehörenden Farbtabellen- 
eintrag zu finden, reicht wie beim Median-Schnitt-Algorithmus ein Top-Down-Lauf 
über den reduzierten Octree. Dabei wird auf jeder Stufe entschieden, auf welcher 
Seite der Schnittebenen der Farbwert liegt. 


Bei einer Implementierung der Octree-Quantisierung braucht der Octree nicht ganz 
aufgebaut zu werden, bevor die Reduktion startet. Statt dessen kann man zur Ein- 
sparung von Speicherplatz Aufbau und Reduktion überlappen: Die Farbwerte des 
Bildes werden nacheinander in den zu Anfang nur aus der Wurzel bestehenden Oc- 
tree eingefügt. Wenn ein Blatt mehr als zwei verschiedene Farbwerte enthält, wird es 
expandiert. Sobald der Octree 256 Blätter enthält, wird er vor der nächsten Einfügung 
reduziert. Dabei kann man entweder die tiefsten Blätter oder diejenigen, die die we- 
nigsten Pixelpunkte enthalten, reduzieren. Bei einer Reduktion merkt man sich nur 
die errechneten Mittelwerte und die Anzahl der von ihnen repräsentierten Farbwerte. 
Nach einer Reduktion können wieder einige neue Farbwerte einsortiert werden. Da- 
durch stellt man sicher, daß der konstruierte Octree auf jeder Zwischenstufe maximal 
256 Blätter enthält. 


Das Verfahren der Octree-Quantisierung liefert in den meisten Fällen ähnlich gute 
Ergebnisse wie der Median-Schnitt-Algorithmus, hat aber wegen der regelmäßigen 
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Abbildung 2.53: Treppenstufeneffekt beim Zeichnen von Linien 


Aufteilung des RGB-Würfels eine geringere Laufzeit und einen geringeren Speicher- 
platzbedarf und ist daher als Kompromißlösung gut geeignet. 


2.7 Behebung von Aliasing-Effekten 


Bei der Darstellung von geneigten Linien mit einer der in Abschnitt 2.1 beschriebenen 
Methoden treten oft Treppenstufeneffekte auf, d.h. der Wechsel der Bildschirmdarstel- 
lung von einer Zeile oder Spalte in die nächste ist deutlich erkennbar, vgl. Abbildung 
2.53. Der gleiche Effekt tritt bei der Darstellung von Ellipsen und anderen Objekten 
auf. Der Grund für das Auftreten dieses Effektes liegt in der diskreten Rasterung des 
Bildschirms und der Tatsache, daß die beschriebenen Verfahren einen Alles-oder- 
Nichts-Ansatz verwenden: ein Pixel wird entweder auf die Farbe des darzustellenden 
Objektes gesetzt oder ganz unberührt gelassen. Eine Erhöhung der Auflösung des 
Bildschirms kann zwar bewirken, daß der Treppenstufeneffekt weniger auffällt, löst 
das Problem aber nicht grundsätzlich. Außerdem sind der Erhöhung der Auflösung 
technische Grenzen gesetzt, vgl. Abschnitt 1.2. Der Treppenstufeneffekt ist ein Spe- 
zialfall der sogenannten Aliasing-Effekte, die in diesem Abschnitt näher untersucht 
werden sollen. Insbesondere ist man daran interessiert, diese Effekte zu beheben 
oder zumindest zu mildern. Techniken, die dies zu erreichen versuchen, werden als 
Anti-Aliasing-Techniken bezeichnet. 


Betrachten wir als Beispiel die Darstellung einer Linie mit Steigung zwischen 0 und 
1. Damit die Linie auf dem Bildschirm zu sehen ist, muß sie mit einer Dicke von min- 
destens einem Pixel dargestellt werden. Man kann also einer Linie einen rechteckigen 
Bereich des Bildschirms zuordnen, der von der Linie überdeckt wird, vgl. Abbildung 
2.54. Wir werden diesen Bereich im folgenden als Linienbereich bezeichnen. Verschie- 
dene Pixel werden verschieden stark überdeckt. Die Idee der Anti-Aliasing-Techniken 
beruht darauf, daß nicht einfach in jeder Spalte genau ein Pixel (nämlich das am mei- 
sten überdeckte) gesetzt wird, sondern daß jedes von der Linie teilweise überdeckte 
Pixel einen Intensitätsbetrag zur Darstellung leistet. Dies bedeutet eine Abkehr vom 
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Abbildung 2.54: Der einer Linie 
zugeordnete rechteckige Bereich des 
Bildschirms. 





Abbildung 2.55: Verschmierung ei- 


ner Linie über mehrere Pixel. 





erwähnten Alles-oder-Nichts-Ansatz, die dargestellte Linie wird über mehrere Pixel 
“verschmiert”. Dadurch wird der wahrnehmbare Treppenstufeneffekt abgeschwächt. 


Die einfachste Möglichkeit besteht darin, daß der Intensitätswert jedes Pixels propor- 
tional zum Grad seiner Überdeckung gewählt wird, siehe Abbildung 2.55. Dies wird 
auch als ungewichtete Flächenberücksichtigung bezeichnet. Daneben gibt es auch die 
Möglichkeit der gewichteten Flächenberücksichtigung, bei der verschiedene von dem 
Linienbereich überdeckte Flächenbereiche je nach Lage unterschiedlich zur Intensität 
eines Pixels beitragen können. Dabei gibt es die Möglichkeit der pizelbezogenen Ge- 
wichtung, bei der ein überdecktes Flächenstück, das näher zum Zentrum des Pixels 
liegt, einen größeren Einfluß auf die Intensität des Pixels hat als ein Flächenstück, 
das am Rande liegt. Eine andere Möglichkeit ist die objektbezogene Gewichtung, 
bei der ein überdecktes Flächenstück, das näher zur Mittellinie des Linienbereiches 
liegt, einen größeren Einfluß auf die Intensität des überdeckten Pixels hat als ein 
Flächenstück, das am Rande der Linie liegt. 


Hier wird auch klar, daß die Voraussetzung für die Anwendung von Anti-Aliasing- 
Techniken der beschriebenen Art darin besteht, daß auf dem Bildschirm mehr als 
zwei Intensitätsstufen darstellbar sind, denn nur dann besteht die Möglichkeit, die 
Intensität proportional zum Grad der Überdeckung zu wählen. Zur formalen Be- 
schreibung der Methode der gewichteten Flächenberücksichtigung führt man eine 
Gewichtsfunktion W : R? — IR (auch Filterfunktion genannt) ein, die jedem Punkt 
P des Bildschirms und damit jedem infinitesimalen Flächenelement dA des Linienbe- 
reiches, dessen Mittelpunkt in P liegt, eine Gewichtung zuordnet, die von der Lage 
von dA abhängig ist. Bei der objektbezogenen Gewichtung ist die Gewichtung von 
dA von der relativen Lage von dA zur idealen Linie abhängig. Bei der pixelbezogenen 
Gewichtung ist die Gewichtung von dA abhängig von der relativen Lage von dA zum 
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Mittelpunkt des zugehörigen Pixels. Wir nehmen in beiden Fällen an, daß die Ge- 
wichtsfunktion so normiert ist, daß der Wert der Gewichtsfunktion W(z,y) für einen 
beliebigen Punkt (z,y) immer zwischen 0 und 1 liegt und daß 


W(z,y) dA(z,y) < 1 


Pixel 


Für pixelbezogene Gewichtung nehmen wir Gleichheit an. Den Beitrag, den ein über- 
deckter Bereich B eines Pixel zu dessen Intensität beiträgt, erhält man durch Wichten 
der einzelnen Flächenelemente und anschließender Summation über B: 


I = Imaz / W(r, y) dA(z, y) 
B 


Dabei ist Imax die Intensität, die ein Pixel maximal annehmen kann. Für die pi- 
xelbezogene Gewichtung wird in [FvDFH90] eine kegelförmige Gewichtsfunktion vor- 
geschlagen, wobei die Spitze des Kegels genau über dem Mittelpunkt des Pixels liegt. 
Der Kreis, der die Grundfläche des Kegels bildet, hat als Radius die Seitenlänge des 
Pixels, die Grundfläche des Kegels ragt also über das Pixel hinaus. Dies führt dazu, 
daß Nachbarpixel gesetzt werden können, auch wenn sie nicht von dem Linienbereich 
überdeckt werden. Außerdem kann ein Flächenbereich zur Intensität von mehreren 
Pixeln einen Beitrag leisten. Die kegelförmige Gewichtsfunktion bewirkt, daß die 
Gewichtung eines Flächenbereiches linear mit seinem Abstand vom Pixelmittelpunkt 
abnimmt. Außerdem wird Rotationssymmetrie sichergestellt, was in [FvDFH90] als 
theoretisch optimal gezeigt wird. 


Zur Beseitigung von Aliasing-Pffekten gibt es verschiedene Ansätze, von denen wir im 
folgenden drei vorstellen wollen. Der erste Ansatz besteht in einer Modifikation des 
Grundalgorithmus zur Erzeugung der primitiven Objekte. Zu diesem Ansatz werden 
wir in Abschnitt 2.7.3 eine mögliche Technik zur Erzeugung von Linien behandeln. 
Der zweite, am meisten verbreitete, Ansatz besteht in einer Nachbehandlung des er- 
zeugten Bildes mit einem sogenannten Postprocessing-Algorithmus. In den Abschnit- 
ten 2.7.2.1 und 2.7.2.2 werden wir die beiden am häufigsten verwendeten Verfahren 
beschreiben. Der dritte Ansatz besteht in der Anwendung einer Filterfunktion auf 
das zu erzeugende Bild, so daß die Frequenzen des darzustellenden Bildes, die ober- 
halb der Nyquist-Frequenz liegen, ausgefiltert werden. Diese Technik, die auch als 
Prefiltering bekannt ist, werden wir im Abschnitt 2.7.2 beschreiben. Zuerst wollen wir 
jedoch in nächsten Abschnitt auf die Ursachen für das Auftreten der Aliasing-Effekte 
etwas näher eingehen. 


2.7.1 Aliasing-Effekte und Fourier-Analyse 


Der bisher erwähnte Treppenstufeneffekt ist nur einer von vielen möglichen Aliasing- 
Effekten. Bevor wir weitere Aliasing-Effekte beschreiben, wollen wir kurz auf die 


90 KAPITEL 2. GRUNDLEGENDE RASTERGRAPHIKALGORITHMEN 


theoretischen Grundlagen eingehen, mit denen diese Effekte erklärt werden können. 
Dazu werden wir zuerst einige Begriffe der Signaltheorie einführen. Eine ausführli- 
chere Beschreibung findet man z.B. in [FvDFH90] und vor allem [GW92). 


Ein Signalist generell eine beliebige Funktion, die Information trägt. Ein kontinuier- 
liches Signal ist eine Funktion, die an allen Stellen des Definitionsbereiches definiert 
ist. Ein diskretes Signal ist dagegen nur an einigen diskreten Punkten definiert. Für 
die Anwendung in der Computergraphik sind zweidimensionale räumliche Signalfunk- 
tionen s : IR? > IR von Interesse, die von den z- und y-Koordinaten des Bildschirms 
abhängig sind. Vor der Darstellung auf dem Bildschirm kann man die Gesamtheit der 
darzustellenden Objekte als kontinuierliches Signal auffassen. Weil für jeden infinite- 
simalen Punkt genau festgelegt ist, welches Objekt für diesen Punkt sichtbar ist, ist 
für jeden Punkt auch ein eindeutiger Intensitätswert bestimmt. Bei der Darstellung 
auf dem Bildschirm wird das die Objekte beschreibende kontinuierliche Signal durch 
ein diskretes ersetzt, das nur an den Pixelpositionen definiert ist. Damit die Darstel- 
lung auf dem Bildschirm die darzustellenden Objekte möglichst gut wiedergibt, sollte 
das diskrete Signal das kontinuierliche möglichst gut repräsentieren. 


Die Umwandlung eines kontinuierlichen Signals in ein diskretes kann als Abtastvor- 
gang beschrieben werden, bei dem das kontinuierliche Signal mit einer bestimmten 
Frequenz abgetastet wird, die von der Auflösung des Bildschirms abhängig ist. Dabei 
entspricht jedes Pixel einem Abtastpunkt. Bei diesem Abtastvorgang können feine 
Details des kontinuierlichen Signals verloren gehen. Dies passiert dann, wenn der 
Abstand der einzelnen Abtastpunkte für die Erfassung der Details zu groß ist. Wenn 
wir das einfache Modell eines Rastergrafiksystems aus Abschnitt 1.2 zugrunde legen, 
entspricht die von dem Abtastvorgang durchgeführte Diskretisierung der vom Dis- 
playprozessor durchgeführten Abbildung der spezifizierten Objekte in den Display- 
Pufferspeicher. Die im Display-Pufferspeicher für die einzelnen Pixel abgelegten In- 
tensitätswerte werden vom Videocontroller auf dem Bildschirm dargestellt. Dabei 
werden die diskreten Intensitätswerte in kontinuierliche analoge Spannungswerte zur 
Steuerung des Bildschirms umgewandelt. Dieser Prozeß wird in der Signaltheorie 
auch als Rekonstruktion bezeichnet, weil versucht wird, aus den Abtastwerten das 
Originalsignal so gut wie möglich zu rekonstruieren. 


Das Verwenden eines einzigen Abtastpunktes für jedes Pixel (der üblicherweise in der 
Pixelmitte liegt) hat den Nachteil, daß kleine Objekte so zwischen den Abtastpunkten 
liegen können, daß sie von keinem der Abtastpunkte getroffen werden. Sie werden 
dann nicht auf dem Bildschirm dargestellt. Bei der Darstellung von bewegten Szenen 
kann es sogar vorkommen, daß ein kleines, sich bewegendes Objekt zu bestimmten 
Zeitpunkten von einem Abtastpunkt getroffen wird, zu anderen Zeitpunkten aber 
nicht, vgl. Abbildung 2.56. Das führt dann bei der Darstellung auf dem Bildschirm 
dazu, daß das Objekt manchmal vom Bildschirm verschwindet und später an ei- 
ner anderen Stelle wieder auftaucht. Dies ist ein sehr unerwünschter Effekt, weil er 
fälschlicherweise das Verschwinden eines Objektes vortäuscht. Eine mögliche Abhilfe 
ist das Verwenden mehrerer Abtastpunkte pro Pixel. Dieses Verfahren ist als Super- 
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Abbildung 2.56: Ein kleines, sich bewegendes Objekt kann je nach Lage zwischen die 
Abtastpunkte fallen (links) und wird nicht dargestellt, oder kann von den Abtastpunkte 
erfaßt werden (rechts) und wird dargestellt. 


sampling bekannt und wird in Abschnitt 2.7.2.1 näher beschrieben. Aber auch bei 
diesem Verfahren kann nicht grundsätzlich ausgeschlossen werden, daß Objekte zwi- 
schen die Abtastpunkte fallen, sie müssen nur entsprechend klein sein. Das Problem 
der verschwindenden und wieder auftauchenden Objekte bei bewegten Szenen besteht 
also grundsätzlich weiter, tritt aber mit steigender Zahl der Abtastpunkte pro Pixel 
immer seltener auf. 


Eine andere Abhilfe ist die bereits erwähnte Methode der (gewichteten oder unge- 
wichteten) Flächenberücksichtigung, bei der die Intensität eines Pixels durch den 
Prozentsatz der von einem Objekt überdeckten Pixelfläche bestimmt wird. Damit 
geht auch der Beitrag von kleinen Objekten nicht verloren. Hier wird auch der Sinn 
einer pixelbezogenen Gewichtsfunktion klar, bei der sich die Gewichtsfunktionen be- 
nachbarter Pixel überlappen: Betrachten wir ein kleines, sich bewegendes Objekt, 
das vom Mittelpunkt eines Pixels PL zum Mittelpunkt des benachbarten Pixel P, 
wandert. Bei Verwendung einer konstanten, nicht-überlappenden Gewichtsfunktion, 
wie sie von der ungewichteten Flächenberücksichtigung verwendet wird, ändert sich 
die Bildschirmdarstellung erst, wenn das Objekt die Pixelgrenze zwischen Pı und 
P, überschreitet. Solange das Objekt vollständig innerhalb der Grenzen eines Pixel 
liegt, bleibt die Bildschirmdarstellung gleich. Auch wenn das Objekt sich gleichmäßig 
bewegt, entsteht auf dem Bildschirm der Eindruck einer ruckartigen Bewegung. Dies 
kann durch Verwendung einer Gewichtsfunktion vermieden werden, die nach dem 
Abstand vom Pixelmittelpunkt wichtet. Dabei sollte eine überlappende Gewichts- 
funktion verwendet werden. Bei Verwendung einer nicht-überlappenden Gewichts- 
funktion (z.B. einer Pyramide, deren Grundfläche die Pixelfläche ist) wird bei der 
Bewegung des Objektes vom Mittelpunkt von Pı zum Mittelpunkt von Py zuerst 
die Intensität von Pi abnehmen, ohne daß die Intensität von P, erhöht wird. Die 
Intensität von P, fängt erst dann an zu wachsen, wenn das Objekt die Grenze zu 
P, überschreitet. Zu diesem Zeitpunkt ist die Intensität von Pı bereits sehr gering. 
Bei einer Bewegung des Objektes über den Bildschirm entsteht der Eindruck einer 
pulsierenden Helligkeit, obwohl das Objekt konstante Helligkeit hat. Eine überlap- 
pende Gewichtsfunktion behebt dieses Problem. In diesem Fall wird die Intensität 
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von Pa schon erhöht, wenn das Objekt sich in Richtung Pa bewegt, noch bevor das 
Objekt die Grenze von P, überschritten hat. Bei geeigneter Wahl der Überlappung 
entsteht so der Eindruck einer gleichmäßigen Bewegung des Objektes mit konstanter 
Helligkeit. 


Wir wenden uns jetzt wieder der Signaltheorie zu und zeigen den Zusammenhang zu 
den Aliasing-Effekten in der Computergraphik, vgl. [Bli89c], [Bli89b] und [FvDFH90]. 
Dazu führen wir zuerst die mathematischen Begriffe Fourier-Transformation, Kon- 
volution und Konvolutionstheorem ein. Wie bereits erwähnt, kann man die Inten- 
sitätsverteilung von Bildern als zweidimensionale Signalfunktion beschreiben. Man 
kann sich diese Funktion dadurch veranschaulichen, daß man über jedem Punkt des 
Bildes die zugehörige Amplitude der Signalfunktion aufträgt. Um die Beschreibung 
zu vereinfachen, werden wir im folgenden nur eindimensionale Signalfunktionen be- 
trachten, die man sich aus einem horizontalen Schnitt durch das darzustellende Bild 
entstanden denken kann. Bei der Darstellung auf dem Bildschirm entspricht das einer 
Bildschirmzeile. 


Die Fourier-Transformierte F(u) einer räumlichen Funktion f(z) ist eine Art Dop- 
pelgänger, die statt im kartesischen Raum im Frequenzraum existiert. Der Zusam- 
menhang zwischen f(z) und F(w) wird durch die Fourier-Analyse beschrieben: Jede 
beliebige Funktion f(x) kann als Summe unendlich vieler Sinus-Funktionen unter- 
schiedlicher Frequenz beschrieben werden. Jede dieser Sinus-Funktionen wird durch 
eine Amplitude und eine Phasenverschiebung spezifiziert. Diese beiden Komponenten 
werden üblicherweise zu einer komplexen Zahl zusammengefaßt. Mathematisch kann 
dies als 


f(x) p- / _ F(u)(cos(ur) — isin(ur))du 

1 © 
—— Fiu)e”"" du, 2.18 

| (2.18) 
dargestellt werden, vgl. z.B. [BS80] oder [Smi82]. Dabei ist i = Y-1. Man be- 
achte, daß die beteiligten Cosinus-Funktionen eigentlich nur um r/2 phasenverscho- 
bene Sinus-Funktionen sind. Zusammen können die Sinus- und Cosinus-Funktionen 
also dazu benutzt werden, Amplitude und Phasenverschiebung der zur Frequenz u 
gehörenden Sinus-Funktion zu beschreiben. F(w) ist die Fourier-Transformierte von 


f(x), die durch 


F(u) Ir I. f(z)(cos(ur) + isin(ur))dz 


1 = wur ” 
= al. f(z) e"” de, (2.19) 
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berechnet wird. F(u) ist also eine komplexe Zahl, die als F{u) = R(u) + iI(u) 
dargestellt werden kann, wobei R(u) der Realteil und /(w) der Imaginärteil ist. Die 
Amplitude von F(u) ist 


IF(u)| = v R’(u) + I?(u) 


Die Phasenverschiebung von F(v) ist 


I(u) 
R(u) 


Grundsätzlich gilt, daß die Fourier-Transformierte F(u) einer Funktion f(x) umso 
größere Amplituden bei höheren Frequenzen hat, je schärfer und detailreicher f(x) 
ist. Wenn f(x) nicht stetig ist, hat F(w) ein unendliches Frequenzspektrum. Wir 
werden im folgenden Fourier-Transformierte meist dadurch darstellen, daß wir ihre 
Amplitude gegen die Frequenz auftragen. Die Phasenverschiebung wird dann nicht 
berücksichtigt. Es sei nochmal darauf hingewiesen, daß die Fourier-Transformierte 
einer Funktion keine neue Information beinhaltet. Sie ist nur eine Beschreibung in 
einem anderen Raum. Der Grund für das Verwenden der Fourier-Transformierten 
besteht üblicherweise darin, daß bestimmte mathematische Operationen auf der 
Fourier-Transformierten einfacher auszuführen sind als auf der Originalfunktion. Es 
ist daher sinnvoll, die Funktion durch ihre Fourier-Transformierte darzustellen, die 
Operation auszuführen und das Ergebnis wieder als Funktion im kartesischen Raum 
darzustellen. Dieses Verfahren wird in der Physik z.B. zur Lösung von partiellen 
Differentialgleichungen eingesetzt. 





d(u) = arctan 


Bevor wir auf die Bedeutung in der Computergraphik eingehen, führen wir den Begriff 
der Konvolution, auch Faltungsprodukt genannt, ein. Seien f(x) und g(z) zwei 
beliebige Eingabefunktionen. Die Konvolution h(z) von f(x) und g(z) wird berechnet 
durch 


ha) = Se) @s(a)= | j fir) le - r) dr 


r ist die Integrationsvariable. g(z) kann als Gewichtsfunktion angesehen werden, 
die über f(x) geschoben wird, wobei für jede Position x die Produktfunktion aus 
f(r) und g(xz — r) berechnet wird. Der Wert der Konvolutionsfunktion h(z) an 
der Stelle x ist der Flächeninhalt unter dieser Produktfunktion. Zur Darstellung der 
Konvolutionsfunktion kann man auch wie folgt vorgehen: Man multipliziert die beiden 
Funktionen und integriert das Resultat. Dies ist der Wert der Konvolutionsfunktion 
an Stelle 0. Dann verschiebt man die Gewichtsfunktion um x nach rechts, multipliziert 
und integriert wieder. Dies ist der Wert an Stelle x. Dieses Verfahren wiederholt man 
für jedes x, welches man graphisch darstellen will. 
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Die Konvolution zweier Funktionen im kartesischen Raum entspricht der Multiplika- 
tion ihrer Fourier-Transformierten im Frequenzraum. Es gilt das Konvolutionsstheo- 
rem, auch Faltungssatz genannt: 


5 | FON) de = VERFQ)Clu 


In [Bli89c] wird dies mit der Logarithmus-Funktion verglichen: die Multiplikation von 
normalen Zahlen wird zur Addition im “Logarithmus-Raum”. Umgekehrt gilt auch, 
daß die Multiplikation zweier Funktionen im kartesischen Raum der Konvolution ihrer 
Fourier-Transformierten im Frequenzraum entspricht. Für viele Funktionen gibt es 
eine Grenzfrequenz ug, nach der die Berechnung des Integrals in (2.18) abgebrochen 
werden kann, weil F(w) = 0 für |u| > ug. Damit wird (2.18) zu 


1 ve -iur 
f(x) = Fl.. F(u)e”""” du 


Ein Satz aus der Signaltheorie besagt, daß eine kontinuierliche Funktion mit endlicher 
Grenzfrequenz uc vollständig durch Abtastwerte mit gleichem Abstand öz repräsen- 
tiert werden kann, wenn öz weniger als halb so groß wie die Periode der Grenzfrequenz 


ist, d.h. wenn 
ör < ! 
2uG 
Die untere Grenze für die Abtastfrequenz wird auch als Nyquist-Frequenz un bezeich- 


net: 
un =2.uG 


Um zu demonstrieren, was passieren kann, wenn ein Signal mit einer Frequenz abge- 
tastet wird, die unterhalb der Nyquist-Frequenz liegt, betrachten wir eine Sinuskurve 
der Frequenz u. Wenn man die Sinuskurve mit einer Frequenz abtastet, die größer 
als 2u ist, kann die Kurve vollständig rekonstruiert werden, vgl. Abbildung 2.57(a). 
Wenn man die Sinuskurve mit einer Frequenz abtastet, die gleich 2u ist, kann man 
die Kurve nur dann rekonstruieren, wenn die Abtastpunkte die Maxima und Minima 
treffen, vgl. Abbildung 2.57(b).. Wenn dies nicht der Fall ist, wird die Amplitude 
evtl. nicht korrekt wiedergegeben. Wenn die Abtastpunkte sogar an den Nullstel- 
len liegen, wird die Funktion als Nullfunktion rekonstruiert werden, vgl. Abbildung 
2.57(c). Wenn man die Sinuskurve mit einer Frequenz abtastet, die kleiner 2u ist, 
wird die Rekonstruktion eine Sinuskurve ergeben, die eine niedrigere Frequenz hat als 
die Originalkurve, vgl. Abbildung 2.57(d). Diese niedrigere Frequenz wird auch als 
Alias-Frequenz bezeichnet. Die Rekonstruktion liefert eine andere Frequenz als die 
Originalfrequenz. Hierher kommt auch die Namensgebung für die Aliasing-Effekte. 
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(a) Abtastfrequenz m/2 





Abbildung 2.57: Veranschaulichung der Entstehung von Aliasing-Frequenzen. 
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In der Computergraphik treten an den Objektgrenzen abrupte Intensitäts- 
sprünge auf. Dies führt dazu, daß die die darstellenden Szenen beschreibenden 
Signalfunktionen Fourier-Transformierte mit unendlichem Frequenzspektrum 
haben. Das Signal kann somit nicht mit einer endlichen Anzahl von Abtast- 
punkten rekonstruiert werden. Die abrupten Übergänge führen zum Auftreten 
der beschriebenen Aliasing-Effekte: An den Objektgrenzen treten die erwähn- 
ten Treppenstufeneffekte auf, weil die Abtastpunkte entweder innerhalb oder 
außerhalb des Objektes liegen. Desweiteren werden Objekte, die nahe beieinan- 
der liegen oder die in der darzustellenden Projektion nahe beieinander liegend 
erscheinen, evtl. nicht richtig auseinandergehalten, weil die Abtastpunkte die 
Zwischenräume verfehlen oder manchmal treffen, manchmal nicht. 


2.7.2 Anti-Aliasing-Techniken 


Die beschriebenen Aliasing-Effekte können dadurch vermieden werden, daß 
man das darzustellende Bild so filtert, daß die Fourier-Transformierte der gefil- 
terten Signalfunktion keine Frequenzen u mit |u| > 1/6x aufweist, wobei öz der 
Abstand der Abtastpunkte ist. Durch das Abschneiden der höheren Frequenzen 
wird zwar das darzustellende Bild verwischt und bestimmte feine Details gehen 
verloren, das gefilterte Bild kann aber korrekt dargestellt werden, Aliasing- 
Effekte treten nicht auf. Wir wollen uns jetzt kurz damit beschäftigen, wie 
ein Filter aussehen muß, damit er das Abschneiden der höheren Frequenzen im 
Frequenzraum erreicht. Das Abschneiden der Frequenzen u mit |u| > 1/öx wird 
ım Frequenzraum durch Verwendung eines Rechteckfilters 


1 für-L<u<st 

= öz —  — br 
sw = | 0 sonst 
erreicht. Man berechnet also eine neue Funktion G(u) = S(u)F(u) im Fre- 
quenzraum durch Multiplikation der Fourier-Transformierten F(u) der Si- 
gnalfunktion f(x) mit der Filterfunktion S(u). Nach dem Konvolutionstheo- 
rem entspricht dies der Konvolution von f(x) mit der umgekehrten Fourier- 
Transformierten s(z) von S(uw). Die umgekehrte Fourier-Transformierte der 
Rechteckfunktion S(u) ist, vgl. [BS80]: 

2 sin -z 


Dies ist im wesentlichen die Funktion sinz/z, die in Abbildung 2.58 wiederge- 
geben ist. Diese Funktion hat für die in der Konvolutionsbildung enthaltene 
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sin(x)/x — 





Abbildung 2.58: Die Funktion sin(z)/x im Bereich zwischen -20 und 20 


Integration den Nachteil, daß sie unendlich breit ist. Das Abschneiden nach 
einem bestimmten Absolutwert des Argumentes bewirkt, daß die zugehörige 
Funktion im Frequenzraum zwar noch das grobe Aussehen einer Rechteckfunk- 
tion hat, die aber in der Nähe der Flanken schwingt. Dies bewirkt, daß einige 
unerwünschte Frequenzen durchgelassen werden, während andere erwünschte 
verstärkt oder abgeschwächt werden. Der Bereich, in dem die Schwingungen 
auftreten, wird umso kleiner, je größer die Ausdehnung der abgeschnittenen 
Funktion ist. Die Amplitude wird aber von der Ausdehnung nicht beeinflußt. 
Vorschläge zur Abschwächung der Amplitude werden z.B. in [Bli89b] gemacht. 
Trotz der erwähnten Nachteile liefert die Konvolution der das Originalbild be- 
schreibenden Signalfunktion mit einer abgeschnittenen sin x/z-Funktion sehr 
gute Ergebnisse. Aliasing-Effekte treten fast nicht mehr auf. Der Nachteil des 
Verfahrens besteht darin, daß die resultierende Berechnung relativ aufwendig 
ist. Aus diesem Grund werden in der Praxis oft andere Filterfunktionen ver- 
wendet, vgl. [Bli89b]. Dazu gehören Box-Filter, Zelt-Filter und Gauß-Filter.Es 
sei noch darauf hingewiesen, daß das Konvolutionsintegral nur für die Position 
der Abtastpunkte berechnet werden muß. 


Das gerade beschriebene Verfahren ist ein Vertreter der sogenannten Vorfilter- 
oder Prefiltering-Techniken, die so genannt werden, weil sie vor der Bildschirm- 
darstellung das vorliegende Bild mit Hilfe einer Filterfunktion so manipulieren, 
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daß bei der Darstellung keine bzw. möglichst wenige Aliasing-Effekte auftreten. 
Ein weiterer Vertreter der Prefiltering-Techniken ist das in [Cat78] beschriebene 
Verfahren, das das durch eine kontinuierliche Intensitätsverteilung beschriebene 
Bild in Quadrate der Größe der Bildschirmpixel unterteilt und zu jedem Qua- 
drat Q die Teile der Polygone des Bildes berechnet, die es ganz oder teilweise 
überdecken. Dies geschieht dadurch, daß alle Polygone bzgl. Q geclippt werden. 
Wenn Polygonteile untereinander innerhalb Q überlappen, werden mit Hilfe ei- 
nes Algorithmus zur Eliminierung verborgener Oberflächen, vgl. Kapitel 4, die 
sichtbaren Polygonteile bestimmt. Zu jedem Quadrat Q wird ein Intensitäts- 
wert /(Q) durch gewichtete Summation über die Polygonteile P berechnet, die 
innerhalb von Q liegen: 


I(Q)= LP): A(P) 


I(P) ist der Intensitätswert des Polygons, zu dem P gehört, A(P) ist der 
Flächeninhalt von P. Das zu Q gehörende Pixel wird mit Intensität /(Q) darge- 
stellt. Dieser Algorithmus wird selten eingesetzt, weil er wegen der Verwendung 
des Algorithmus zur Eliminierung verborgener Oberflächen und wegen der Olip- 
Operation bzgl. aller Pixelquadrate viel Rechenzeit braucht. Verbesserungen, 
die dies zu beheben versuchen, sind in [Car84] und [AWW85] beschrieben. 


Neben der Möglichkeit, die Aliasing-Effekte vor der Rasterung zu beheben, 
gibt es auch die Möglichkeit, das bereits gerasterte Bild so zu manipulieren, 
daß die auftretenden Aliasing-Effekte abgeschwächt werden. Diese Methode, 
die auch als Nachfiltern oder Postfiltering bezeichnet wird, ist sehr verbreitet, 
weil die damit verbundenen Berechnungen leicht auszuführen sind. Wir werden 
im folgenden die beiden am häufigsten verwendeten Postfiltering-Algorithmen 
kurz beschreiben: Supersampling und Filtern, vgl. auch [BG89]. Obwohl beide 
Verfahren im Gegensatz zu den gerade beschriebenen Prefiltering-Techniken, 
die einen wohlfundierten theoretischen Hintergrund haben, eher Heuristiken 
sind, liefern sie in den meisten Fällen ähnlich gute Ergebnisse bei geringerer 
Rechenzeit. Aus diesem Grund sind die Postfiltering-Techniken auch die am 
meisten angewendeten Anti-Aliasing-Verfahren. 


2.7.2.1 Nachfiltern mit Supersampling 
Die Supersampling-Methode beruht auf der Beobachtung, daß die Aliasing- 


Effekte mit steigender Bildschirmauflösung abnehmen. Das darzustellende Bild 
wird — unter Verwendung der in den Abschnitten 2.1 und 2.2 beschriebenen 
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Abbildung 2.59: 4 x 4-Filter zur 
Mittelung der Intensitätswerte des er- 
rechneten Rasterbildes. Die einzel- 
nen Einträge geben an, mit welchem 
Faktor das zugehörige Pixel gewichtet 
wird. Die Summe der Gewichtsfakto- 
ren ergibt 1. 






Rasterungsalgorithmen - für eine höhere Auflösung gerastert als sie der Bild- 
schirm tatsächlich zur Verfügung stellt. Üblicherweise verwendet man eine in 
z- und y-Richtung um einen Faktor 2 bis 4 vergrößerte Auflösung. Faktor 4 
versechzehnfacht die Anzahl der Abtastpunkte. Zu jedem Bildschirmpixel kor- 
respondiert dann ein Block von 16 Pixeln in dem Rasterbild hoher Auflösung. 
Der Intensitätswert eines Bildschirmpixels errechnet sich als Mittelung der In- 
tensitätswerte der zugehörigen 16 Pixel in dem errechneten Rasterbild. Die 
durchgeführte Mittelung kann auch als Anwendung eines 4 x 4-Filters auf das 
Rasterbild aufgefaßt werden. Kopien dieses Filters werden so auf das Rasterbild 
gelegt, daß jedes Pixel von genau einer Kopie bedeckt ist. Da bei der Mittelung 
der Intensitätswerte jedes Pixel in einem 16er Block gleich berücksichtigt wird, 
sind alle Einträge des 4 x 4-Filters identisch. Man erhält den in Abbildung 
2.59 wiedergegebenen Filter. Durch Verwendung eines Filters mit unterschied- 
lichen Einträgen erreicht man eine ungleiche Gewichtung der Intensitätswerte 
der Pixel des Rasterbildes, vgl. Abbildung 2.60. Es ist auch möglich, einen 
größeren Filter zu verwenden, z.B. einen 6 x 6-Filter. In diesem Fall wird der 
Filter zur Berechnung der Intensitätswerte zentriert auf den Pixelblock gelegt 
und die Intensitätswerte der darunterliegenden Pixel werden mit den Einträgen 
des Filters gewichtet. Es entsteht dann eine Verwischung der Intensitätswerte 
benachbarter Pixel, ähnlich wie sie mit der im nächsten Abschnitt verwendeten 
Filter-Methode erreicht wird. 


Die Supersampling-Methode liefert zufriedenstellende Ergebnisse bei der Dar- 
stellung von Bildern mit dicken Linien oder ausgefüllten Objekten. Bei der Dar- 
stellung von Bildern, die aus dünnen Linien bestehen, führt die Anwendung der 
Supersampling-Methode zu einer wenig kontrastreichen Darstellung, vgl. Abbil- 
dung 2.61. Durch die Verwendung von geeigneten Filtern mit nicht gleichmäßi- 
gen Gewichtseinträgen kann dieser Effekt etwas abgeschwächt werden, wird je- 
doch nicht vollständig behoben. Bei Verwendung der Supersampling-Methode 
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Abbildung 2.60: 4 x 4-Filter, 
bei dem die Intensitätswerte der 
näher zum Mittelpunkt des 4 x 4- 
Pixelblockes liegenden Pixel stärker 
gewichtet werden. Die Summe der 
Gewichtsfaktoren ist wieder 1. 





ist für das Errechnen und Abspeichern des Rasterbildes ein hoher Rechenzeit- 
und Speicherplatzaufwand erforderlich: Bei Verwendung einer in z- und y- 
Richtung um Faktor vier erhöhten Auflösung versechzehnfacht sich sowohl die 
Rechenzeit als auch der Speicherplatzbedarf. Man kann diesen Nachteil durch 
ein adaptives Supersampling beheben, das nur in den Bildbereichen mit einer 
erhöhten Auflösung arbeitet, in denen Aliasing-Eflekte auftreten können. In 
Bereichen mit konstanter Intensität wird dagegen mit der Auflösung des Bild- 
schirms gerastert. Es sei hier noch die Methode des stochastischen Supersamp- 
ling erwähnt, vgl. [CPC84], [C0086], die auch beim Ray-Tracing-Verfahren ein- 
gesetzt wird, siehe Kapitel 8. Die Grundidee dieses Verfahrens besteht darin, die 
Position der verwendeten Abtastpunkte um einen zufälligen Betrag zu stören, 
der mit Hilfe einer Wahrscheinlichkeitsverteilung bestimmt werden kann. Die 
eingeführten Störungen verursachen ein Rauschen, in dem die Aliasing-Effekte 
idealerweise verschwinden. Diese Methode ist besonders für das Ray-Tracing- 
Verfahren geeignet und wird in Kapitel 8 noch näher beschrieben. 


2.7.2.2 Nachfiltern ohne Supersampling 


Bei der Filter-Methode wird aus dem darzustellenden Bild ein Rasterbild mit 
der Auflösung des Bildschirms erzeugt. Danach wird aus diesem Rasterbild 
die Bildschirmdarstellung durch Mittelung der Intensitäten benachbarter Pixel 
erzeugt. Man kann sich das so vorstellen, daß ein Filter über die Pixel des 
Rasterbildes geschoben wird, mit dem die Intensitäten der darunterliegenden 
Pixel gemischt werden. Dies führt zu einem “Verschmieren” der Intensitäten 
der Pixel des Rasterbildes über mehrere Pixel des Bildschirms. Ein möglicher 
Filter ist in Abbildung 2.62 wiedergegeben. 


Wenn /(z,y) der Intensitätswert von Pixel (z,y) im errechneten Rasterbild ist, 
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Abbildung 2.61: Verwendung der Supersampling-Methode zur Darstellung von dünnen 
Linien. Als Filter wird ein 4 x 4-Filter mit gleichmäßiger Gewichtsverteilung benutzt. 
Links ist das errechnete Rasterbild skizziert. In jedem Pixelbereich sind genau vier Pixel 
gesetzt. Rechts sind die Intensitätswerte der zugehörigen Bildschirmpixel angegeben. Die 
auf der Linie liegenden Bildschirmpixel werden nur auf 1/4 der Maximalintensität gesetzt, 
die Linie wird also relativ dunkel erscheinen. 


Abbildung 2.62: 3 x 3-Filter zur 
Verwendung bei der Filter-Methode. 
Die Summe der Gewichtsfaktoren er- 
gibt 1. 





so ergibt sich bei Verwendung des Filters aus Abbildung 2.62 der Intensitätswert 
O(z,y) des Bildschirmpixels (z,y) zu: 


O(z,y) -I(z-1,y-1)+2/(&,y-1)+ &I(e+1,y-1) 
+ sIe-1Ly) +olay) +alle+l,y) 
+ al@-1Ly+l)+glay+l) + zslle+ly+l) 


Damit diese Formel auch für Pixel am Rand des Bildschirms anwendbar ist, 
sollten vor der Anwendung der Filter-Technik die Randzeilen und -spalten 
des errechneten Rasterbildes verdoppelt werden. Für Bildschirme mit hoher 
Auflösung hat die Anwendung eines 3 x 3-Filters eine relativ geringe Auswir- 
kung auf die erzeugte Bildschirmdarstellung. In diesem Fall kann man entweder 
den 3 x 3-Filter aus Abbildung 2.62 mehrmals anwenden oder einen größeren 
Filter verwenden. Ein Beispiel für einen 5 x 5-Filter findet man in Abbildung 
2.63. 


Das Filter-Verfahren kann mathematisch als Konvolution einer diskreten Inten- 
sitätsfunktion / mit einer diskreten Filterfunktion f beschrieben werden. Wenn 
(p, q) ein beliebiges Pixel des Bildschirms ist, errechnet sich die Intensität O(p, q) 


von (p,9) zu 
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Abbildung 2.63: 5 x 5-Filter zur 
Verwendung bei der Filter-Methode 
für hohe Bildschirmauflösungen. Die 
Summe der Gewichtsfaktoren ist wie- 
der 1. Dieser Filter ist als Bartlett- 
Filter bekannt, vgl. [Cro81]. 





XÄRES-ı YRES-1 


oBd)= ), . Mas)+fp-ng-y) 


z=0 y=0 


I(z,y) beschreibt die Intensitätswerte der Pixel des Rasterbildes und ist außer- 
halb des Bildschirmbereichs 0. f(u,v) ist die Filterfunktion, die nur im Bereich 
des verwendeten Filters einen Wert ungleich 0 hat. Die Filterfunktion zum 
3 x 3-Filter aus Abbildung 2.62 ist z.B.: 


: für u=v=0 
flusw) 2 für (w=0Ound |o)| =1) oder (v=0 und |u| = 1) 
u,v) = . 
4 für [u=bl=i 
0 sonst 


2.7.3 Anti-Aliasing mit modifiziertem Grundalgorith- 
mus 


Ein weiterer Ansatz zur Milderung der Anti-Aliasing-Effekte besteht darin, die 
zur Bildschirmdarstellung von Linien, Kreisen, Ellipsen und anderen Grundele- 
menten verwendeten Algorithmen zu modifizieren. Wir betrachten als Beispiel 
den Bresenham-Algorithmus, siehe Abbildung 2.5. Der Algorithmus kann so 
modifiziert werden, daß beim Anwachsen der Abweichung von der idealen Linie 
(angegeben durch die Variable error) die Intensität des eigentlich zu setzenden 
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void line(xi,y1,x2,y2,Imax) 
int x1,y1,x2,y2,Imax; 


{ 


int error,x,y,dx,dy,Ipix; 


dx=x2-x1; dy=y2-yl; 

error=-dx/2; 

y-yl; 

Ipix=0; 

for(x=x1; x<=x2; x++){ 
set pixel(x,y,Imax-Ipix); 
set pixel(x,y+1,Ipix); 
error+=dy; 

if(error>=0) { 





error-=dx; 


} 


Ipix = error*Imax/dx; 





Abbildung 2.64: Modifizierter Bresenham-Algorithmus zur Darstellung einer Linie im 
ersten Oktanden mit Anti-Aliasing-Komponente. Es werden immer zwei übereinanderlie- 
gende Pixel auf einen Intensitätswert gesetzt, der umso kleiner ist, je größer der Abstand 
von der idealen Linie ist. 
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Pixels reduziert, die des benachbarten Pixels erhöht wird. Diese Modifikation 
ist in Abbildung 2.64 durchgeführt, siehe auch [BG89]. 


Das menschliche Auge hat die Eigenschaft, daß es zwei nebeneinanderliegende 
Pixel der Intensität //2 als dunkler empfindet als ein Pixel der Intensität I. Aus 
diesem Grund wird die Prozedur aus Abbildung 2.64 Linien erzeugen, die eine 
alternierende Helligkeitsverteilung entlang der Linie zu haben scheinen. Man 
kann dies beheben, indem man die Intensitätsargumente Ipix und Imax-Ipix 
der beiden verwendeten set_pixel-Anweisungen mit einen multiplikativen Kor- 


rekturfaktor wichtet. In [BG89] wird dazu der Faktor 


) 


vorgeschlagen. k ist eine Konstante, die typischerweise zwischen 0.2 und 0.5 
liegt. Bei Variation von Ipix nimmt « für k # 0 seinen maximalen Wert für 
Ipix=0.5 * Imaxan. Die Konstante k kann je nach Anwendung gewählt wer- 
den. Ein ausgefeilterer Algorithmus zur Bildschirmdarstellung von Linien, auf 
den wir hier nicht weiter eingehen können, ist der Gupta-Sproull-Algorithmus, 


vgl. [FvDFH90], [GS81]. 


2. Ipix 
Imax 





e=1+k(1-[i 





Kapitel 3 


Dreidimensionale 
Computergraphik 


Wir werden in diesem Kapitel die für die mathematische Beschreibung der drei- 
dimensionalen Computergraphik notwendigen Begriffe und Verfahren vorstel- 
len. Dazu werden wir die in der Computergraphik üblicherweise verwendeten 
homogenen Koordinaten einführen und zeigen, wie man bei Verwendung die- 
ser Koordinaten die Durchführung linearer Transformationen wie Translation, 
Rotation oder Skalierung und Projektionen mathematisch als Anwendung von 
geeignet definierten Matrizen gleicher Größe beschreiben kann. Die einheitliche 
Beschreibung dieser Operationen ist sehr vorteilhaft, weil man damit das Hin- 
tereinanderausführen mehrerer Operationen zu einer Gesamtoperation zusam- 
menfassen kann, die durch eine Matrix beschrieben wird. Die Gesamtoperation 
kann damit kostengünstig durch Anwendung einer Matrix ausgeführt werden. 


Danach werden wir einen allgemeinen Rahmen für die Darstellung von Ob- 
jekten oder Objektgruppen vorstellen und beschreiben, wie bei gegebener Be- 
trachterposition und gegebenem Projektionsfenster die durchzuführende Abbil- 
dung der Objekte auf das Projektionsfenster mathematisch beschrieben werden 
kann. Der vorgestellte Rahmen wird mit leichten Abwandlungen von vielen 
Graphikpaketen! wie z.B. PHIGS benutzt. Zuerst werden wir jedoch im 
ersten Abschnitt dieses Kapitels einige grundlegende mathematische Begriffe 
einführen, vgl. auch [Far90], [G0186] und [Lam83]. 


!Ein Graphikpaket ist im wesentlichen eine Programmiersprache, mit der Objekte mani- 
puliert werden können. 
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3.1 Mathematische Grundbegriffe 


Die dreidimensionale Computergraphik arbeitet im dreidimensionalen Raum, 
d.h. die darzustellenden Objekte werden als Punktmengen im dreidimensio- 
nalen euklidischen Raum IE? definiert. Vom dreidimensionalen euklidischen 
Punktraum IE? zu unterscheiden ist der dreidimensionale euklidische Vektor- 
raum IR°, dessen Elemente Vektoren sind. Punkte aus JE? haben eine Position, 
aber keine Richtung und keine Länge. Vektoren aus IR? haben eine Richtung 
und eine Länge, aber keine Position. Wir werden ım folgenden Punkte durch 
Klein- oder Großbuchstaben mit einem Querstrich, Vektoren durch Klein- oder 
Großbuchstaben mit Pfeilen bezeichnen. Wenn (i, 7, k) eine Basis des IR? ist, 
läßt sich ein beliebiger Vektor U € IR? als Linearkombination 


i=scty+ zk 


darstellen. Dabei sind x,y,z € IR. Die einzelnen Komponenten des geordneten 
Tupels (z,y,2z) heißen Koordinatenwerte von ü bzgl. der Basis (@, 7, k). Wir 
setzen im folgenden eine feste Basis (1, 7, k) als gegeben voraus und beschreiben 
die Tatsache, daß ein Vektor ö bzgl. dieser Basis die Koordinaten (z,y,z) hat 
kurz mit 9 = (z,y,z). Die Länge eines Vektors Ü = (z,y,z) € IR? wird mit 
Hilfe des Standard-Skalarproduktes definiert als 


öl=ver+y?+7 


Zu zwei Punkten & und 5 des euklidischen Raumes IE? gibt es einen Vektor 
vo € IR?, der von ä nach b zeigt. Ü berechnet sich zu b-ä. Auf der anderen Seite 
gibt es zu jedem Vektor U € IR? unendlich viele Punkte & und b, für deüd=b-ä 
gilt: Wenn ä,b € IE? ein solches Paar ist, dann ist &+£, b+£ für ein beliebiges 
2 € IR? wegen U = (b+2)-(ä+Z) ein anderes Paar. Punkte aus JE? können nur 
subtrahiert werden, das Ergebnis ist ein Vektor aus IR?. Die Addition zweier 
Punkte aus IE? ist nicht definiert. Es ist aber möglich, einen Vektor £ € IR? zu 
einem Punkt & € IE? zu addieren. Das Ergebnis ist ein Punkt b=ä+7e IE°. 
Der Abstand zweier Punkte & und b aus IE? ist definiert als die Länge des von ä 
nach 5 zeigenden Vektors d = b-äü. Wenn ö € IE? ein fester Punkt ist, wird der 
Vektor &-05 € IR? als der Ortsvektor von ä bzgl. des Ursprungs 5 bezeichnet. 
Wir werden im folgenden den Ortsvektor eines Punktes @ € IE? durch ä € IR? 
darstellen. Wenn ö € IE? ein fester Ursprung und (G, 7, k) eine Basis des IR° ist, 
so nennt man (ö51,J, k) ein (affines) Koordinatensystem des IE®. i, 7, k werden 
auch als Koordinatenrichtungen oder Koordinatenachsen bezeichnet. Wenn 
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o= zi+ y7+ zk 


1 


ist, nennt man das Tupel (z, y,z) die Koordinatenwerte von a bzgl. des ‚Koordi- 
natensystems (ö; 1.7, k). Weil ö ein beliebiger Punkt aus IE? ist und i, J, k eine 
beliebige Basis des IR® ist, gibt es beliebig viele Koordinatensysteme des IE°. 
Wir nehmen i im folgenden an, daß (?, }, k) eine Orthonormalbasis des IR? ist, 
d.h. daß :, 7, k Länge 1 haben und daß sie senkrecht aufeinander stehen. Man 
kann zwischen rechtshändigen und linkshändigen Koordinatensystemen unter- 
scheiden: ein rechtshändiges Koordinatensystem liegt vor, wenn ıxj= k ist, 
ein linkshändiges Koordinatensystem liegt vor, wenn xj = -kist. Als Faust- 
regel gilt: Wenn Daumen und Zeigefinger der rechten Hand in Richtung von i 
und 5 zeigen, zeigt in einem rechthändigen System der Mittelfinger in Richtung 
k. Wenn der Mittelfinger in Richtung — -k zeigt, liegt ein linkshändiges System 
vor. 


Eine weitere auf Punkte aus JE? anwendbare Operation ist die affine Kombi- 
nation, die auch als baryzentrische Kombination bezeichnet wird: Die affine 
Kombination von Punkten bo,‘ ,b„ € JE? ist definiert als 


b = 5 a;jb; 
j=0 


mit @,''',m € Rund ao +: +an = 1. Weil sich der Ausdruck auf der 
linken Seite der Gleichung umformen läßt zu 


ist dies keine unerlaubte Addition von Punkten aus IE?, sondern die Addition 
des Vektors ”; 1 a;(b; _ bo) zum Punkt bo. Das Ergebnis ist ein Punkt b € 
IE’. Die Koeffizienten &,‘'',@n werden auch als affine Koordinaten von b 
bzgl. bo, * ,b„ bezeichnet. Der Koeflizient a; kann als Gewichtsfaktor aufgefaßt 
werden, der angibt, wie der Punkt b; bei der Bildung der affinen Kombination 
zu gewichten ist. Eine konvere K ombination ist eine affine Kombination, bei der 
alle Koeffizienten a; > 0 sind. Die konvexe Kombination der Punkte bo, ‚b, 
liegt immer innerhalb der konvexen Hülle der Punkte. 


Die meisten der in der Computergraphik auf Objekte angewendeten Operatio- 
nen wie z.B. Translation und Rotation sind affine Abbildungen. Die Definition 
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des Begriffes der affinen Abbildung stützt sich auf den Begriff der affinen Kom- 
bination: Eine Abbildung ® : IE? — IE? heißt affine Abbildung, wenn sie affine 


Kombinationen unverändert läßt, d.h. wenn 


b = Ta;B, 


j=0 


eine affine Kombination und ® : IE? — IE? eine affine Abbildung ist, gilt: 


ö(b) = )_,;0(b;) 


—_Q 


Die Anwendung einer affinen Abbildung läßt also die Gewichtsfaktoren un- 
verändert: Die Anwendung einer affinen Abbildung ® auf einen Punkt b, der die 
affine Kombination der Punkte bo, -,b„ mit den Gewichtsfaktoren ao,‘ '' ,@n 
ist, liefert den gleichen Punkt wie die affine Kombination der Punkte ®(bo), ---, 
ö(b,) mit den gleichen Gewichtsfaktoren &o,‘'',@n. Das bedeutet beispiels- 
weise, daß bei der Anwendung einer affinen Abbildung auf ein Geradensegment 
s der Mittelpunkt von s auf den Mittelpunkt des affinen Bildes ®(s) abgebildet 
wird. Wenn man einen Punkt b € IE? durch einen dreielementigen Spaltenvek- 
tor darstellt, läßt sich eine affline Abbildung ® darstellen als 


() = Ab+Z (3.1) 


Dabei ist A eine 3x3-Matrix und Z ein Vektor aus IR®. Daß durch Ab+ x 
eine affline Abbildung beschrieben wird, sieht man an der Tatsache, daß diese 
Abbildung affıne Kombinationen unverändert läßt: 


s()_,;b;) 


j=0 


A), a;b;) +£ 
j=0 
= Ab; + I, @j8 
j=0 j=0 
= ) a;(Ab; +5) 
j=0 


= ‚2 a;ö(b;) 


3.1. MATHEMATISCHE GRUNDBEGRIFFE 109 


Beispiele für affine Abbildungen sind Translationen, Rotationen, Skalierungen 
und Scherungen: Eine Translation r wird anhand Gleichung 3.1 durch die Ein- 
heitsmatrix I und den Translationsvektor £ beschrieben, d.h. es ist r(b) = Ib+2. 
Eine Skalierung o wird durch eine Diagonalmatrix D beschrieben, deren Dia- 
gonaleinträge für je eine Dimension einen Skalierungsfaktor angeben, d.h. es ist 
o(b) = Db. Eine Rotation p um die z-Achse mit Winkel $ wird durch eine 
Rotationsmatrix beschrieben: 


cosd —-sind 0 
R,=| sind cosd 0 
0 0 1 


Es ist also p(b) = R,b. 


Eine Scherung & wird durch eine Schermatrix beschrieben. Scherungen in x- 
und y-Richtung, die die z-Richtung unverändert lassen, werden z.B. beschrie- 
ben durch Matrizen der Form 


d.h. es ist d(b) = Sb. Affine Abbildungen können kombiniert werden, so daß 
eine komplexe Abbildung als eine Folge von einfachen Abbildungen zusammen- 
gesetzt werden kann. Man kann zeigen, daß sich jede beliebige affine Abbildung 
aus Translationen, Skalierungen, Rotationen und Scherungen zusammensetzen 


läßt. 


Der Rang der in Gleichung 3.1 verwendeten Matriz A hat eine wichtige geo- 
metrische Interpretation: Wenn rang(A) = 3 ist, bildet die affine Abbildung 
dreidimensionale Objekte in dreidimensionale Objekte ab. Wenn rang(A) < 3 
ist, wird dagegen eine Parallelprojektion in den zwei- oder eindimensionalen 
Raum vorgenommen. In der Computergraphik werden affıine Abbildungen mit 
rang(A) = 3 häufig als lineare Transformationen bezeichnet. Parallelprojek- 
tionen, d.h. affine Abbildungen mit rang(A) < 3 werden zusammen mit den 
perspektivischen Projektionen kurz als Projektionen bezeichnet, vgl. Abschnitt 
3.4.? 


2Man beachte, daß perspektivische Projektionen keine affinen, sondern projektive Abbil- 
dungen sind. Projektive Abbildungen können als Verallgemeinerung der affinen Abbildun- 
gen aufgefaßt werden. Wir können hier nicht weiter auf projektive Abbildungen eingehen, 
vgl. [Far90], [PP86] für eine ausführlichere Behandlung. 
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Wir werden im folgenden Punkte und Vektoren immer als Spaltenvektoren dar- 
stellen. In diesem Fall wird die Anwendung einer durch eine Matrix M beschrie- 
benen Operation auf einen Punkt @ € IE? mit der Matrizen-Multiplikation 


b= Mä durchgeführt: 


b. mMı ma Ma Gr 
, |=| mı ms Me Ay 
b, m? Me Mg Q; 


Es entsteht die Spaltenvektor-Beschreibung des Punktes b. Es gibt auch die 
Möglichkeit, @ durch einen Zeilenvektor darzustellen. Dann wird die durch M 
beschriebene Operation mit der Matrizen-Multiplikation 


mMı Ma Mr 
(b. b, ,)=(.. Ay a, ) ma Ms Ma 


M3 Me Mg 


durchgeführt. Es wird also die transponierte Matrix MT verwendet. Wir werden 
in diesem Buch immer die Darstellung durch Spaltenvektoren verwenden. Im 
Text werden wir einen Spaltenvektor 


meist als (b,, b,, b,)? darstellen. 


3.2 Homogene Koordinaten 


Translation und Rotation sind in der Computergraphik sehr häufig verwendete 
lineare Transformationen. Oft ist es bequem, Objekte in einem lokalen Koordi- 
natensystem zu definieren und danach mit Hilfe von Translationen und Rota- 
tionen zu plazieren. Dabei kann die Symmetrie der Objekte ausgenutzt werden 
und das definierte Objekt kann an mehrere Stellen plaziert werden. Wie wir 
im letzten Abschnitt gesehen haben, kann eine Translation eines Punktes & um 
einen Vektor £ durch die Operation b= Jä+ £ beschrieben werden, eine Rota- 
tion eines Punktes a kann als Multiplikation von & mit einer Rotationsmatrix R 
beschrieben werden: b= Ra. Die Motivation für das Einführen der homogenen 
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Koordinaten besteht darin, die Addition bei der Berechnung der Translation zu 
eliminieren, so daß beide Transformationen durch Matrizen-Multiplikationen 
beschrieben werden. Damit wird eine leichtere Kombinierbarkeit der linearen 
Transformationen erreicht. Ein Punkt aus JE°?, den wir bisher durch einen drei- 
elementigen Spaltenvektor (z,y,z)? von reellen Zahlen dargestellt haben, wird 
bei der Verwendung von homogenen Koordinaten durch einen vierelementigen 
Spaltenvektor (X,Y, Z,w)T von reellen Zahlen repräsentiert. Dabei ist w £ 0 
ein Skalierungsfaktor. Die kartesischen Koordinaten des durch (X,Y,Z,w)? 
dargestellten Punktes sind 


2 
w 


Man beachte, daß zwei Spaltenvektoren von homogenen Koordinaten densel- 
ben Punkt beschreiben können, wenn unterschiedliche Skalierungsfaktoren w 
verwendet werden: (X,Y,Z,w)? und (tX,tY,tZ,w/t)T” mit t # 0 beschreiben 
denselben Punkt. In der Computergraphik wird üblicherweise nur der Skalie- 
rungsfaktor w = 1 verwendet. Wenn bei einer Berechnung eine Beschreibung 
(X,Y,Z,w)T mit w # 1 entsteht, so wird diese vor der weiteren Verwendung 
“homogenisiert”, d.h. es wird für die weitere Berechnung die den gleichen Punkt 
darstellende Beschreibung 


verwendet. Die homogenen Koordinaten (X,Y, Z,w)? eines Punktes aus IE° 
können auch als kartesische Koordinaten eines Punktes aus JE? aufgefaßt wer- 
den. Alle den gleichen Punkt aus IE? beschreibenden 4-Tupel, d.h. alle Tupel 
(tX,tY,tZ,w)? mit t # 0, beschreiben als kartesische Koordinaten interpre- 
tiert eine Gerade im IE*. Die beschriebene Homogenisierung entspricht einer 
Projektion auf die Ebene w = 1 des IE%. 


Bei Verwendung von homogenen Koordinaten wird ein Punkt des JE? durch 
einen 4-elementigen Spaltenvektor beschrieben. Lineare Transformationen wer- 
den daher durch 4x4 Matrizen dargestellt. Wir werden jetzt angeben, wie diese 
Matrizen für Translation, Rotation, Skalierung und Scherung aussehen. Dabei 
werden wir der Einfachheit halber nicht mehr zwischen Punkten aus JE? und 
deren Beschreibung durch homogene Koordinaten unterscheiden. 


Ein Punkt ä € IE? mit den homogenen Koordinaten (@,,@,,4,,1)” wird um 
einen Vektor Z mit den kartesischen Koordinaten (dx,dy,dz)’ durch Anwen- 
dung der Matrix 
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100 d 
„_][ 010 d 
Ta=lo01«& 
00071 
verschoben. Es gilt: 
100 ds Gr A, + de 
010 || | | _| ay+dy 
001 dz a.,1i I a,+dz 
0001 1 l 


Die zu T inverse Matrix beschreibt eine Translation um den Vektor —Z. Daher 
ist 


100 -de 
112 ’ 010 -d 
TO=STCD=|g01 dr 
000 ı 


Wie man leicht nachrechnet, wird das Hintereinanderausführen zweier Transla- 
tionen um Vektoren £} = (dxı,dyı,dzı)” und #2 = (dea,dya,dz2)” durch die 
Matrix 


T(&ı +2) =T(£ı) T(&o) = 


beschrieben, die durch Multiplikation der beiden zu £, und Z£, gehörenden 
Translationsmatrizen T}(£ı) und T3(£z) entsteht. 


Das Skalieren einer Menge von Punkten des IE® bedeutet, daß jede Komponente 
der die Punkte beschreibenden Spaltenvektoren mit einem konstanten Faktor 
multipliziert wird. Das Skalieren eines Punktes & mit den homogenen Koordi- 
naten (a,,@,,a,,1)7 um die Skalierungsfaktoren (s,,s,,s;) liefert den Punkt ä’ 
mit den homogenen Koordinaten 


(S242, 3yQy, 324;, 1)? 
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Die Skalierungsoperation wird durch Multiplikation mit einer Skalierungsmatrix 
beschrieben: $(s,, sy, s;): 


SzAdz Ss 0 00 Az 
Say | _I 09 3, 00 Ay 
8204, I 00,0 d, 

1 00071 1 


Wenn der Skalierungsfaktor < 1 ist, verkleinert die Skalierungsoperation ein 
Objekt und schiebt es näher zum Ursprung. Bei Verwendung von unterschied- 
lichen Skalierungswerten für die verschiedenen Komponenten wird das Objekt 
entlang einer bestimmten Koordinatenachse gedehnt oder gestaucht. Im Ur- 
sprung zentrierte Objekte verändern ihre Lage nicht. Die zu 5 inverse Matrix 
ist: 


l/s;, 0 0 0 

5 1, _ 0 1, 0 0 

S(s2, Sy, $z) Bee he 0 0 1/s, 0 
0 0 0 1 


Das Hintereinanderausführen zweier Skalierungsoperationen mit den Skalie- 
rungsfaktoren (sz1,8y1,3z1) und (822, $y2, 322) wird durch die Matrix 


S12(821 “822, Syı ' Sy2, Sz1 ' S22) — S,(8z1, Syl; S21) ‘ S2(s22, Sy25 $22) 
Sri ' Sr2 0 0 0 
5 0 sa 0 0 
u 0 0 Szı ' S22 0 
0 0 0 


beschrieben, die durch Multiplikation der beiden zu (s21,5y1,$z1) und 
(322, 8y2, 822) gehörenden Skalierungsmatrizen $1 (821, Sy1, 821) und $2(8z2, 3y2, 822) 
entsteht. 


Das Skalieren von Objekten relativ zu einem Punkt © mit den homogenen Ko- 
ordinaten (Cz,Cy,Cz,1)” anstatt relativ zum Ursprung ö mit den homogenen 
Koordinaten (0,0,0,1) erreicht man, indem man zuerst eine Translation um 
den Vektor —C = ö—- © durchführt, die den Punkt cin den Ursprung verschiebt. 
Dann führt man die gewünschte Skalierung aus und wendet eine Translation 
um den Vektor d=c-ö.an, die den Punkt © wieder an die ursprüngliche Stelle 
bringt. Die Gesamttransformation wird durch eine Matrix Sges beschrieben, die 
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durch Multiplikation der die Einzeloperationen beschreibenden Matrizen T(-), 
S und T(©) entsteht: 


Sg = T(d):5-T(-2) 
100 & s, 000 100 -c 
_ 010% 0 3, 00 010 -c 
. 001 cc 0 5 0 001 -c 
0001 0 0 1 000 1 


0 3,0 «(l-s,) 
00, „(l-s,) 
000 1 


0 
0 
Ss 0 0 | 


Als Scherung bezeichnet man eine Transformation, die alle Punkte &, = 
(Gi2,Giy,iz)7 € IE? eines Objektes in Punkte ä} = (ai,,a;,,a‘,)’ entsprechend 
folgendem Zusammenhang transformiert: 


4, = (iz + 514, + 824; 
iv 7 $S3lie + Ay + Salız 
Q;, = Sslix + Sei, + (iz 


a 
j) 


Dies läßt sich bei Verwendung von homogenen Koordinaten auch als Multipli- 
kation der Punkte ä; = (a;.,Q;,,@iz,1)7 des Objektes mit einer Schermatrix der 
Form 


l Ss 5 0 
s 1 5 0 
S5 Se 1 0 
0001 


beschreiben. Üblicherweise werden Scherungen meist nur in einer oder zwei Ko- 
ordinatenrichtungen durchgeführt, vgl. Abbildung 3.1. Eine nur in z-Richtung 
erfolgende Scherung wird durch die Matrix 


ooorm 
oom& 
omMo% 
Moo6o00 
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| u // B 
zT Scherung in z-Richtung Scherung in y-Richtung 


Abbildung 3.1: Veranschaulichung der Scherung im zweidimensionalen Raum an einem 
Rechteck. 


beschrieben. 


Eine Rotation erfolgt immer um eine vorgegebene Achse, die z.B. durch An- 
gabe eines auf der Achse liegenden Punktes @ € IE? und eines in Richtung der 
Achse zeigenden Vektors d € IR? spezifiziert werden kann. Es ist aber auch 
möglich, die Achse durch zwei auf der Achse liegende Punkte aus IE? zu spe- 
zifizieren. Wir werden hier zuerst beschreiben, wie eine Rotation um eine der 
Koordinatenachsen ausgeführt wird. 


Wir nehmen an, daß ein rechtshändiges Koordinatensystem verwendet wird und 
daß die auszuführenden Rotationen im mathematisch positiven Sinn erfolgen. 
Eine Rotation um eine der Koordinatenachsen erfolgt im mathematisch posi- 
tiven Sinn, wenn beim Blick in Richtung der negativen Drehachse gegen den 
Uhrzeigersinn gedreht wird?. Die Rotation eines Punktes & € IE? um einen 
Winkel & wird als Multiplikation mit einer Rotationsmatrix beschrieben. Die 
Rotationsmatrix ist abhängig von der als Drehachse verwendeten Koordinaten- 
achse. R,, R, und R, sind die Rotationsmatrizen für Drehungen um z-, y- und 


z-Achse: 


10 0 0 csd® 0 sind 0 

| 0 cosd -siınd 0 1.0 100 

R.(d) = 0 sind cod 0 |’ R=| _ sind 0 cos&d 0 
0 0 0 1 0 00 1 


3In einem linkshändigen Koordinatensystem werden Rotationen im mathematisch positi- 
ven Sinn im Uhrzeigersinn ausgeführt, wenn man in Richtung der negativen Drehachse blickt. 
Diese Festlegung liefert identische Rotationsmatrizen für rechtshändige und linkshändige Ko- 
ordinatensysteme. 
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cosd -sind 0 0 

sin COS 00 

R,($) m 4 4 1 0 
0 0 0 1 


Die zu R,, R, und R, inversen Matrizen erhält man durch die Substitution 
&— -d und Verwendung der Beziehungen: 


cos(-$) = cos($) sin(-#) = - sin($) 


Damit ist z.B. R,'!(#) = R.(-$) = R.(#)’. Als Beispiel für die Herleitung 
der Matrizen betrachten wir die Drehung eines Punktes @ = (a,,a,,a,,1)” um 
die z-Achse, vgl. Abbildung 3.2. Der Drehwinkel sei d und der Zielpunkt sei 
ä'= (a',a',a',1)”. Wenn 0 der Winkel des Ortsvektors von & mit der 2-Achse 


zI"y) 2) 
ist, gilt: 
a, = Jäl- cos(0 +6) 
= Jal-(cos0.cosd - sind -sind) 
= 0,'c08d—-a,-sind 
a, = Jä|-sin(0 +) 
= Jjä|- (sind-cosd+ cos - sin $) 
= a,'cosd+a,:sind (3.2) 
Also ist 
al cos® -sind 0 0 (dr 
+ _ 1% sind csd 00 | | | _p. 
a 0010 | 
l 0 0 0 1 1 


Für das Hintereinanderausführen zweier Rotationen um die Winkel dı und &; 
gilt wegen der Additionstheoreme für Sinus- und Cosinusfunktion: 


Rz(ı + #2) = Ra(dı) Re(d2) 


3.3. ROTATION UM EINE BELIEBIGE ACHSE 117 





: . A 
laTcos(& + 9) 
\ä| cos 0 
Abbildung 3.2: Drehung eines Punktes & um den Winkel $. Für die Koordinaten a, 


und a, von ä gilt: a, = |ä| cos, a, = |äl sin 6 


J Abbildung 3.3: Spezifikation einer 


Rotationsachse durch Angabe eines 


ar Aufpunktes ä und einer Richtungsvek- 
ß tor 7. ä sei der Ortsvektor von ä, 
a g d.h. = ä — ö, wenn ö der Urprung 


des verwendeten Koordinatensystems 
T ist. 


3.3 Rotation um eine beliebige Achse 


Bisher haben wir nur die Rotation um eine der Koordinatenachsen beschrie- 
ben. Eine Rotation um eine beliebige Achse erhält man durch Zusammensetzen 
mehrerer Rotationen und Translationen. Wir nehmen im folgenden an, daß 
die Rotationsachse durch einen Aufpunkt @ € IE? und einen Richtungsvektor 
7 € IR° spezifiziert ist. Alle auf der Achse liegenden Punkte werden dann durch 
die Gleichung 


g=ütyur 


beschrieben, die man auch als (parametrisierte) Geradengleichung bezeichnet. 
u € IR ist dabei der Parameter der Gleichung. Wenn r’ die Länge 1 hat, gibt u 
den Abstand der Punkte vom Aufpunkt an, siehe auch Abbildung 3.3. 


Die Rotation um die angegebene Achse g mit dem Winkel $ wird aus meh- 
reren Einzeltransformationen zusammengesetzt, die sich zu der gewünschten 
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Abbildung 3.4: Veranschaulichung der Rotation um eine beliebige Achse anhand des 
Richtungsvektors 7. Die linke Abbildung zeigt eine Drehung um die y-Achse, die den im 
Ursprung aufgetragenen Richtungsvektor r’in die (yz)-Ebene dreht. Die rechte Abbildung 
zeigt eine Drehung um die z-Achse, die den in der (yz)-Ebene liegenden Richtungsvektor 
?' so dreht, daß er in Richtung der positiven z-Achse zeigt. 


Gesamttransformation zusammensetzen, wenn man sie nacheinander ausführt. 
Die durchzuführenden Einzeltransformationen sind: 


(1) Translation um —@ = ö - ä, die den Aufpunkt @ der Achse g in den 
Ursprung verschiebt. 

(2) Rotation um die y-Achse, so daß g in der Ebene x = 0, d.h. in der 
(yz)-Ebene, zu liegen kommt, siehe Abbildung 3.4. 

(3) Rotation um die x-Achse, so daß der Richtungsvektor von g in Richtung 
der z-Achse zeigt, siehe Abbildung 3.4. 

(4) Rotation um die z-Achse mit dem gewünschten Winkel 9. 

(5) Umkehrtransformationen der in den Schritten (1) bis (3) verwendeten 
Transformationen, die die Achse und den Aufpunkt wieder in die ur- 
sprüngliche Lage bringen. 


Wir werden im folgenden die durchzuführenden Einzeltransformationen et- 
was genauer beschreiben. & = (a,,a,,a,,1)” sei der Aufpunkt der Achse, 
f = (fz,Ty,rz)” sei der Richtungsvektor. 7’ habe Länge 1, d.h. es sei 
Yr2+r2+r2 = 1. Im ersten Schritt wird & mit Hilfe einer Translation um 
-4 = ö-üG in den Ursprung verschoben. Dies wird durch Anwenden der 
folgenden Translationsmatrix erreicht: 


T(-3) = 


> OO 09 
> oo 
SS mo 

| 

Q 

« 
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z Abbildung 3.5: Veranschaulichung 
_, der Rotation um die y-Achse: Die 
r Abbildung zeigt eine Projektion auf 


die (zz)-Ebene, die y-Achse zeigt in 
die Zeichnung hinein. Um den im Ur- 


sprung aufgetragenen Richtungsvek- 
tor f’ in die (yz)-Ebene zu bringen, 
> muß eine Drehung um den Winkel 


0, durchgeführt werden, der abhängig 
T von der Lage von 7’ ist. 


=, 
N 
gr 


Tr 


Im zweiten Schritt wird eine Rotation um die y-Achse ausgeführt, die die Ro- 
tationsachse g in die Ebene x = 0 dreht. Abbildung 3.5 zeigt einen Blick auf 
die (rz)-Ebene, aus dem man die folgenden Beziehungen für den Drehwinkel 
6, ersieht: 


r r 
cosd, = —, sin, = -— 
v v 


Dabei ist v = /r2 +r2 die Länge der Projektion von r auf die (xz)-Ebene. 
Die gewünschte Drehung um die y-Achse wird also durch die folgende Rotati- 
onsmatrix beschrieben: 


= 02:0 
O® ® 
0 0 0 
R,(0ı) = Tr Tz 
-=2020 
U U® 
0 001 


Im dritten Schritt wird eine Rotation um die z-Achse ausgeführt, die den im 
Ursprung aufgetragenen Richtungsvektor der Achse so dreht, daß er ın Richtung 
der z-Achse zeigt. Abbildung 3.6 zeigt einen Blick auf die (yz)-Ebene, aus dem 
man die folgenden Beziehungen für den Drehwinkel 6, ersieht: 


cos6, = v sin®,=[r, 


Man beachte, daß r die Länge 1 hat. Die gewünschte Drehung um die z-Achse 


wird also durch die folgende Rotationsmatrix beschrieben: 
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z 
zu 
rL=v r" 
Ty J 
R.(0;) — 


OO 05 + 


Try 
0 


Abbildung 3.6: Veranschaulichung 
der Rotation um die z-Achse: Die 
Abbildung zeigt eine Projektion auf 
die (yz)-Ebene, die z-Achse zeigt aus 
der Zeichenebene heraus. Der nach 
der ersten Rotation in der (yz)-Ebene 
liegende Richtungsvektor 7” wird so 
gedreht, daß er in Richtung der po- 
sitiven z-Achse zeigt. Da die er- 
ste Drehung um die y-Achse erfolgte, 
hat 7’ die gleiche „-Komponente wie 
f. Die z-Komponente von f” ist die 
Länge der Projektion des ursprüngli- 
chen Richtungsvektors r’auf die (22)- 
Ebene, die wir oben mit v bezeichnet 


haben. 


0 0 
—r, 0 
vo 
0 1 


Im vierten Schritt wird die Rotation mit dem spezifizierten Winkel $ um die 
z-Achse durchgeführt. Die zugehörige Transformationsmatrix ist 


R.(8) = 


cosd —sind 0 
sınd cosd 0 
1 
0 


u > Bu > Fe 


In den nächsten Schritten werden die in den ersten drei Schritten durchgeführ- 
ten Tranformationen wieder rückgängig gemacht. Dies wird durch Anwendung 
der zu den angegebenen Matrizen gehörenden inversen Matrizen erreicht. Die 
Gesamttransformation der Rotation um eine beliebige Achse wird durch die 
Produktmatrix der angegebenen Matrizen beschrieben: 


Rges(a,F,6) = T(@) - Ry(01)"" - Rz(82)"" : Rz($) - R2(82)  Ry(61) - T(-8) 


Das Rotieren eines Objektes um eine durch einen Aufpunkt @ und einen 
Richtungsvektor r’ beschriebene Achse mit einem Winkel & erreicht man 
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durch Anwenden der die Gesamttransformation beschreibenden Rotationsma- 
trix Ryes(a, 7, $) auf jeden Punkt b des Objektes: 


3.4 Projektionen 


Projektionen sind Abbildungen, die dreidimensionale Objekte in den zwei- oder 
eindimensionalen Raum abbilden. Wir betrachten hier die für die Computer- 
graphik relevanten Projektionen in den zweidimensionalen Raum, vgl. auch 
[FvDFH90], [BG89], [CP78] und [ES88]. Projektionen werden in der Com- 
putergraphik benutzt, um nach der Definition der darzustellenden Objekte im 
dreidimensionalen Raum eine zweidimensionale Darstellung auf dem Bildschirm 
zu erzeugen. Wir werden in diesem Abschnitt einige allgemeine Eigenschaf- 
ten von Projektionen und ihre mathematische Darstellung beschreiben. In den 
Abschnitten 3.5 und 3.6 beschäftigen wir uns dann mit der Frage, wie eine 
allgemeine Projektion spezifiziert und eflizjent berechnet werden kann. 


Eine Projektion ist bestimmt durch Angabe eines Projektionszentrums, das der 
Position des Betrachters entspricht, und einer Projektionsebene, in der der Bild- 
schirm als rechteckiges Fenster spezifiziert ist. Geometrisch kann man eine 
Projektion punktweise konstruieren, indem man vom Projektionszentrum aus 
Strahlen - Projektoren genannt — ausgesendet, die durch jeden Punkt des zu 
projizierenden Objektes gehen. Die Schnittpunkte der Projektoren mit der 
Projektionsebene definieren die Projektion, vgl. Abbildung 3.13. Diese Pro- 
jektionen nennt man auch ebene geometrische Projektionen, weil die Projektion 
auf eine Ebene erfolgt und weil die verwendeten Projektoren Geraden sind. Wir 
werden im folgenden nur ebene geometrische Projektionen betrachten. Prinzi- 
piell kann man je nach Lage des Projektionszentrums zwei Klassen von ebenen 
geometrischen Projektionen unterschieden, die perspektivische und die parallele 
Projektion, siehe Abbildung 3.7. Bei der perspektivischen Projektion hat das 
Projektionszentrum einen endlichen Abstand von der Projektionsebene. Eine 
perspektivische Projektion ist deshalb durch Angabe der Projektionsebene und 
des Projektionszentrums eindeutig bestimmt. Bei der parallelen Projektion hat 
das Projektionszentrum unendlichen Abstand von der Projektionsebene, alle 
Projektoren verlaufen parallel zueinander. Die parallele Projektion ist spezifi- 
ziert durch Angabe der Projektionsebene und der Projektionsrichtung. 


Die Anwendung einer perspektivischen Projektion führt zum Auftreten einer 
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Abbildung 3.7: Veranschaulichung von perspektivischer und paralleler Projektion: Die 
linke Abbildung zeigt die Anwendung einer perspektivischen Projektion auf ein Geraden- 
segment AB. Die Projektoren gehen vom Projektionszentrum P aus und erzeugen das 
Bild A’B’ auf der Projektionsebene. Die rechte Abbildung zeigt die Anwendung einer 
parallelen Projektion auf das Geradensegment AB. Die Projektoren verlaufen parallel 
zueinander und erzeugen das Bild A’B’ auf der Projektionsebene. 


perspektivischen Verkürzung, die bewirkt, daß in der Projektion? von zwei gleich- 
großen Objekten das vom Projektionszentrum weiter entfernt liegende Objekt 
kleiner erscheint.Dies führt zwar zu einem realistischen Aussehen der abgebil- 
deten Objekte, bewirkt aber auch, daß Winkel und Abstände in der Projektion 
nicht mehr mit den Originalwinkeln und -abständen übereinstimmen. Im Ori- 
ginalobjekt parallele Kanten sind in der Projektion nur dann parallel, wenn 
sie parallel zur Projektionsebene liegen. Alle anderen parallelen Geraden lau- 
fen in der Projektion in einem Fluchtpunkt zusammen. Dies ist der Punkt, 
in dem eine durch das Projektionszentrum verlaufende Gerade, die parallel zu 
den parallelen Geraden verläuft, die Projektionsebene schneidet. Die Flucht- 
punkte von Geraden, die parallel zu einer Ebene verlaufen, liegen immer auf 
einer Gerade in der Projektionsebene. Wenn diese dem Beobachter als horizon- 
tal verlaufend erscheint, wird sie als Horizontgerade bezeichnet. Die Lage der 
Horizontgerade bestimmt, ob ein Objekt von oben oder von unten betrachtet 
erscheint, vgl. Abbildung 3.8. Die perspektivische Verkürzung wird dadurch 
hervorgerufen, daß ım Originalobjekt parallele Geraden in der Projektion zu- 
sammenlaufen. Die Fluchtpunkte, die zu parallel zu den Koordinatenachsen 
verlaufenden Geraden gehören, werden als Achsen-Fluchtpunkte bezeichnet. Je 
nach Lage der Projektionsebene hat man bis zu drei Achsen-Fluchtpunkte: 
Wenn die Projektionsebene parallel zu einer der Koordinatenachsen liegt, gibt 


“Wir verwenden im folgenden den Begriff Projektion sowohl als Bezeichnung für eine Ab- 
bildung vom drei- in den zweidimensionalen Raum als auch für das durch die Anwendung 
dieser Abbildung entstehende Bild auf der Projektionsebene. 


3.4. PROJEKTIONEN 123 





Abbildung 3.8: Perspektivische Projektion eines Würfels mit drei bzw. zwei Achsen- 
Fluchtpunkten. Da in den linken Abbildungen die Horizontgerade oberhalb des Objektes 
liegt, ist dieses von oben betrachtet dargestellt. In den rechten Abbildungen liegt die 
Horizontgerade unterhalb des Objektes, dieses ist daher von unten betrachtet dargestellt. 


es zu dieser Achse keinen endlichen Fluchtpunkt, weil die zu dieser Achse par- 
allelen Geraden auch in der Projektion parallel abgebildet werden. Da die 
Projektionsebene zu höchstens zwei Koordinatenachsen parallel sein kann, gibt 
es aber mindestens einen Achsen-Fluchtpunkt. Perspektivische Projektionen 
werden üblicherweise nach der Anzahl der Achsen-Fluchtpunkte unterschieden. 
Die Achsen-Fluchtpunkte können zur Konstruktion von Projektionen verwen- 


det werden, vgl. Abbildung 3.8. 


Durch Anwendung einer Parallelprojektion erfolgt keine perspektivische Ver- 
kürzung’. Ein mit Parallelprojektion dargestelltes Objekt hat daher im all- 


5Es können unterschiedliche konstante Verkürzungen entlang der unterschiedlichen Koor- 
dinatenachsen auftreten, vgl. unten. 
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Abbildung 3.9: Axonometrische rechtwinklige Parallelprojektion eines entlang der Ko- 
ordinatenachsen ausgerichteten und mit einer Ecke im Ursprung liegenden Würfels. Die 
an den Kanten stehenden Werte geben die uniformen Verkürzungen entlang der zugehöri- 
gen Koordinatenachse an. Links ist eine isometrische Projektion wiedergegeben, bei der 
entlang der drei Koordinatenachsen eine gleiche Verkürzung erfolgt. In der Mitte ist eine 
dimetrische Parallelprojektion wiedergegeben, bei der entlang der £&- und z-Achse eine 
gleiche Verkürzung erfolgt. Rechts ist eine trimetrische Parallelprojektion wiedergegeben, 
bei der entlang aller drei Koordinatenachsen unterschiedliche Verkürzungen erfolgen. 





Abbildung 3.10: Schiefwinklige Parallelprojektion eines mit einer Ecke im Ursprung lie- 
genden Würfels. Links ist eine Kavalierprojektion wiedergegeben, bei der die Projektoren 
ım Winkel von 45° auf der Projektionsebene eintreffen. In der Mitte ist eine Kabinettpro- 
jektion wiedergegeben, bei der die Projektoren im Winkel von etwa 63° eintreffen. Mit 
Kavalierprojektion dargestellte Objekte erscheinen manchmal zu dick, mit Kabinettpro- 
jektion dargestellte Objekte erscheinen manchmal zu dünn. Die rechts wiedergegebene 
Projektion, bei der die Projektoren in einem Winkel von etwa 56° eintreffen und damit 
eine Verkürzung von 2/3 hervorrufen, liefert oft ein besseres Bild. 
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gemeinen ein weniger realistisches Aussehen als ein mit perspektivischer Pro- 
jektion dargestelltes. Dafür werden aber je nach Lage der Projektionsebene die 
Abstandsverhältnisse richtig wiedergegeben, weil die Abstände in der Projektion 
bis auf einen Skalierungsfaktor richtig dargestellt werden. Im Original parallele 
Geraden bleiben in der Projektion parallel. Winkel werden dagegen nur für 
die Seiten des Objekts, die parallel zur Projektionsebene liegen, richtig darge- 
stellt. Grundsätzlich unterscheidet man zwei Arten von Parallelprojektionen, 
die rechtwinklige Parallelprojektion und die schiefwinklige Parallelprojektion. 
Bei der rechtwinkligen Parallelprojektion stehen die Projektoren senkrecht auf 
der Projektionsebene, bei der schiefwinkligen Parallelprojektion treffen die Pro- 
jektoren dagegen nicht im rechten Winkel auf der Projektionsebene auf. Je nach 
Lage der Projektionsebene werden rechtwinklige und schiefwinklige Projektio- 
nen weiter unterschieden, vgl. Abbildung 3.11. Rechtwinklige Parallelprojek- 
tionen werden in Hauptrisse und axonometrische Projektionen unterschieden. 
Ein Hauptriß, auch Seitenansicht genannt, entsteht, wenn die Projektionsebene 
senkrecht auf einer der Koordinatenachsen steht, ansonsten liegt eine axono- 
metrische Projektion vor, vgl. Abbildung 3.9. Eine axonometrische Projektion, 
bei der die Projektionsebene mit allen drei bzw. zwei der drei Koordinatenach- 
sen einen gleichen Winkel hat, wird isometrische bzw. dimetrische Projektion 
genannt. Wenn die Projektionsebene mit allen drei Koordinatenachsen unter- 
schiedliche Winkel bildet, liegt eine trimetrische Projektion vor. Rechtwinklige 
Parallelprojektionen geben Winkel und Abstände einer Seite eines Objektes im- 
mer dann exakt wieder, wenn diese parallel zur Projektionsebene ausgerichtet 
ist. Dies ist für eine Seitenansicht immer der Fall. Für alle nicht parallel zur 
Projektionsebene liegenden Seiten eines Objektes führt die Anwendung einer 
axonometrischen Projektion zu einer uniformen Verkürzung, die nicht mit dem 
Abstand von der Projektionsebene zunimmt. Daher werden Längen bis auf 
einen konstanten Skalierungsfaktor richtig wiedergegeben. Für Koordinaten- 
achsen, die von der Projektionsebene im gleichen Winkel geschnitten werden, 
ist auch die uniforme Verkürzung gleich. Schiefwinkligen Parallelprojektionen 
werden nach dem Winkel zwischen den Projektoren und der Projektionsebene 
unterschieden. Häufig verwendete schiefwinklige Projektionen sind die Kava- 
kerprojektion, bei der der Winkel 45° beträgt, und die Kabinettprojektion, bei 
der der Winkel arctan(2) > 63.4° beträgt. Der Winkel zwischen den Projek- 
toren und der Projektionsebene bestimmt die Verkürzung von senkrecht auf 
der Projektionsebene stehenden Geradensegmenten und damit die Dicke des 
dargestellten Objektes. Bei der Kavalierprojektion werden solche Geradenseg- 
mente ohne Verkürzung wiedergegeben, bei der Kabinettprojektion tritt eine 
Verkürzung von 1/2 auf, vgl. Abbildung 3.12. Abbildung 3.10 zeigt Beispiele 


für schiefwinklige Parallelprojektionen. 
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Abbildung 3.11: Klassifizierung der ebenen geometrischen Projektionen nach [CP78]. 





B=B’ y _#' B=B’ Y A 


Abbildung 3.12: Uniforme Verkürzung bei der Kavalier- und Kabinettprojektion. Die 
Projektionsebene steht senkrecht auf der Zeichenebene. Für die links wiedergegebene Ka- 
valierprojektion gilt 2/y = tan45° = 1, es ist also 2 = y. Für die rechts wiedergegebene 
Kabinettprojektion ist tand = z/y = 2, also x = 2y. 
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Wir werden im folgenden ebene geometrische Projektionen mathematisch durch 
4 x 4-Matrizen beschreiben, deren Anwendung der Durchführung der Projek- 
tion entspricht. Die Verwendung von 4 x 4-Matrizen hat den Vorteil, daß diese 
einfach mit evtl. durchzuführenden linearen Transformationen zu kombinieren 
sind, so daß die Gesamtoperation durch eine Matrix beschrieben werden kann. 
Da alle Projektionen eine Abbildung in den zweidimensionalen Raum vorneh- 
men, sind die sie beschreibenden Matrizen singulär. Wir machen zuerst die 
Annahme, daß die Projektionsebene parallel zur (zy)-Ebene liegt und zeigen 
dann in Abschnitt 3.6 wie man daraus die Beschreibung für eine beliebige Lage 
der Projektionsebene herleitet. Für perspektivische Projektionen nehmen wir 
an, daß das Projektionszentrum ım Ursprung liegt und daß der Abstand der 
Projektionsebene zur (zy)-Ebene d > 0 sei. Für Parallelprojektionen nehmen 
wir an, daß die Projektionsebene mit der (zy)-Ebene zusammenfällt. 


3.4.1 Perspektivische Projektion 


Bei der perspektivischen Projektion steht die Projektionsebene im Abstand d > 
0 senkrecht auf der z-Achse, die Gleichung der Projektionsebene ist also z = d. 
Das Projektionszentrum liegt im Urspung, vgl. Abbildung 3.13. & = (z,y, 2,1)? 
sei ein Punkt des zu projizierenden Objektes. Die Projektion ä, = (2, Yp 2p, 1)” 
von & erhält man nach Abbildung 3.14 durch Anwendung des Strahlensatzes. 
Es gilt mit z, = d: 


Also 
? z/d ’r 2/d | 


zZ 


Die Division durch z bewirkt die perspektivische Verkürzung, die weiter vom 
Projektionszentrum entfernt liegenden Objekten eine kleinere Projektion zuord- 
net als näher liegenden Objekten. Die Gleichungen (3.3) gelten für alle Werte 
von z außer z = 0. z = 0 ist nicht möglich, weil dann die vom Projektions- 
zentrum (0,0,0,1)? ausgehenden Projektoren die Projektionsebene gar nicht 
treffen. Die von den Gleichungen (3.3) durchgeführten Operationen werden 
auch durch die folgende Matrix beschrieben: 


Poer = (3.4) 


0 
0 
1 
1/d 
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Abbildung 3.13: Die Projektion eines Punktes @ = (z,y,z,1)? auf die Projektionsebene 
ergibt den Punkt ä, = (2, Yp, 2» 1)7. 










= (z,y,z) 


(£p, Yp, d) Yp 


a= (r,y,z) 


(Zp, Ypı d) 


zZ 


Abbildung 3.14: Die linke Abbildung zeigt den Blick in Richtung der negativen y- 
Achse auf die (zz)-Ebene. Die y-Achse zeigt aus der Zeichenebene heraus. z = d ist die 
Gleichung der Projektionsebene. Die rechte Abbildung zeigt den Blick in Richtung der 
positiven z-Achse auf die (yz)-Ebene. Die z-Achse zeigt in die Zeichenebene hinein. 
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Die Anwendung dieser Matrix auf einen Punkt @ = (z,y,z,1)? liefert: 


R z 
= Per a-= (2,9,2,7)" 


Die Normalisierung der vierten Koordinate auf 1 zeigt, daß @, der gewünschte 
Punkt auf der Projektionsebene ist: 


(IL T 
a (zahl 


3.4.2 Parallelprojektion 


Bei der Herleitung der Matrizen für die Parallelprojektion nehmen wir wie bei 
der perspektivischen Projektion an, daß die Projektionsebene senkrecht auf der 
z-Achse steht. Da die Lage des Schnittpunktes der Projektionsebene mit der 2- 
Achse für das Aussehen der Projektion keine Rolle spielt, nehmen wir an, daß 
die Projektionsebene mit der (zy)-Ebene zusammenfällt, d.h. daß d = 0 ist. 
Bei der rechtwinkligen Parallelprojektion stehen die Projektoren senkrecht auf 
der Projektionsebene. Wenn wir annehmen, daß die Projektoren in Richtung 
negativer z-Achse verlaufen, ist die Gleichung eines durch einen Punkt @ = 
(z,y,2,1)? eines Objektes verlaufenden Projektors 


P=ä-uk nen 
Dabei ist k der Einkeitsvektor in Richtung der z-Achse. Dieser Projektor schnei- 


det die Projektionsebene z = 0 im Punkt &, = (z,y,0,1)7. Diese Operation 
wird durch Anwendung der folgenden Matrix auf @ beschrieben: 


Port = (3.5) 


oooo0 
m > Bu un Bu u) 


oOOO - 
OO mo 


Die schiefwinkligen Parallelprojektion ist durch den Richtungsvektor d = 
(d.,d,,d,)’ der Projektoren definiert. Wir nehmen an, daß d, #£ 0 ist, weil 
sonst die Projektoren parallel zur Projektionsebene verlaufen würden, eine Ab- 
bildung auf die Projektionsebene wäre nicht möglich. Die Gleichung eines Pro- 
jektors, der durch einen Punkt & = (x,y,z,1)? eines zu projizierenden Objektes 
verläuft lautet: 
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5=&-ud ne 


Den Schnittpunkt &, = (2,,4p,2p,1)7 des Projektors mit der Projektionsebene 
z = 0 erhält man aus 0 = z — u :d, durch Einsetzen des Parameterwertes 
u = z/d, in die Projektorgleichung. Es ergibt sich 


%. = 2- de 
z 

% = yozıd 

%, >= 0 


Diese Operation wird durch Anwendung der folgenden Matrix auf @ beschrieben: 


10 -d/d, 0 
0 1 -d,/d, 0 

Pu=| 0, Wld 0 (3.6) 
0 0 0 1 


3.5 Spezifikation einer beliebigen Projektion 


Bisher haben wir angenommen, daß eine Projektion durch Festlegung einer Pro- 
jektionsebene und eines Projektionszentrums bzw. einer Projektionsrichtung be- 
stimmt ist. Üblicherweise spezifiziert man zusätzlich zu diesen Angaben noch 
einen rechteckigen Bereich auf der Projektionsebene, Fenster genannt, der den 
auf dem Bildschirm darzustellenden Teil der Projektion enthält. Außerdem 
spezifiziert man ein Sichtvolumen, das den Teil des Objektraumes enthält, der 
auf die Projektionsebene abgebildet werden soll. Wir werden jetzt beschreiben, 
wie die genannten Spezifikationen vorgenommen werden können. Dabei wer- 
den wir uns an das häufig verwendete Standardpaket PHIGS (für Programmer ’s 
Hierarchical Interactive Graphics System) halten, vgl [HHHW91], [Gas92] und 
[FvDFH90]. Leider wird in der von PHIGS verwendeten Notation nicht klar zwi- 
schen Punkten und Vektoren unterschieden, wie wir dies bisher getan haben. 
Um dem Leser das Arbeiten mit PHIGS zu erleichtern und um zu vermeiden, daß 
er wieder eine neue Terminologie erlernen muß, verwenden wir trotz dieses Nach- 
teils die Notation von PHIGS und versuchen durch die begleitende Beschreibung 
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YUP 





VPN 
Abbildung 3.15: Spezifikation des Koordinatensystems auf der Projektionsebene. 


die notationellen Ungenauigkeiten zu entschärfen. Andere Graphikpakete wie 
z.B. GKS benutzen ähnliche Festlegungen wie die hier beschriebenen, vgl. [DI82] 
und [ES88]. Die Beschreibung in diesem und dem nächsten Abschnitt lehnt sich 
eng an |FvDFH90] an. 


Die Projektionsebene, auch Sichtebene (view plane) genannt, wird durch An- 
gabe eines Normalenvektors VPN (view plane normal vector) und eines auf 
der Ebene liegenden Referenzpunktes VRP (view reference point) definiert. 
Zur Definition des auf der Projektionsebene liegenden Fensters braucht man 
ein in der Projektionsebene liegendes Koordinatensystem. Dieses als (uv)- 
Koordinatensystem bezeichnete System wird mit Hilfe eines Vektors VUP (view 
up vector) definiert, der im Referenzpunkt aufgetragen wird. Die Projektion 
von VUP auf die Projektionsebene parallel zu VPN definiert die v-Achse des 
Koordinatensystems auf der Projektionsebene. Die u-Achse des Koordinaten- 
systems steht senkrecht auf der v-Achse, siehe Abbildung 3.15. VRP, VPN 
und VUP sind in dem gleichen Koordinatensystem spezifiziert wie die darzu- 
stellenden Objekte. Dieses rechtshändige Koordinatensystem wird als Welt- 
koordinatensystem bezeichnet. Davon zu unterscheiden ist das linkshändige 
Bildschirm-Koordinatensystem, das sich in der Computergraphik wegen seiner 
Anschaulichkeit eingebürgert hat: wenn die x- und y-Achse in Richtung der 
waagerechten bzw. senkrechten Bildschirmkante zeigt, zeigt die z-Achse in den 
Bildschirm hinein. VPN bildet mit dem in der Projektionsebene liegenden 
(uv)-Koordinatensystem ein rechtshändiges Koordinatensystem, das auch als 
Sicht-Koordinatensystem VRC (viewing reference coordinate system) bezeich- 
net wird. 
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Abbildung 3.16: Spezifikation des Fensters auf der Projektionsebene. 


Mit Hilfe des (uv)-Koordinatensystems wird durch Angabe des linken unte- 
ren Eckpunktes (Umin, Ymin) und des rechten oberen Eckpunktes (Umaz, Umaz) 
ein Fenster auf der Projektionsebene definiert, vgl. Abbildung 3.16. Der 
Mittelpunkt CW (center of window) des Fensters liegt im Punkt (3(uUmaz + 
Umin); > (Umaz + Umin))-. Man beachte, daß CW nicht mit dem Urprung des 
(uv)-Koordinatensystems zusammenfallen muß. Der VUP-Vektor bestimmt 
die Ausrichtung des (uv)-Koordinatensystems auf der Projektionsebene und 
damit die Ausrichtung des Fensters. Diese bestimmt, ob die Objekte auf dem 
Bildschirm aufrecht oder gekippt dargestellt werden. 


Bei der perspektivischen Projektion muß ein Projektionszentrum, bei der par- 
allelen Projektion eine Projektionsrichtung definiert werden. Beide Angaben 
definiert man mit Hilfe eines Projektions-Referenzpunktes PRP (projection 
reference point). Bei einer perspektivischen Projektion gibt PRP das Pro- 
jektionszentrum an, bei einer Parallel-Projektion ist die Projektionsrichtung 
DOP (direction of projection) durch den von PRP zu CW zeigenden Vektor 
definiert. PRP wird üblicherweise nicht im Weltkoordinatensystem, sondern 
im VRC-Koordinatensystem spezifiziert, damit eine Veränderung der Lage der 
Projektionsebene auch PRP entsprechend verändert. Dann braucht ein Pro- 
grammierer z.B. nach Spezifikation einer Kavalier-Projektion nach Änderung 
der Lage der Projektionsebene PRP nicht neu zu setzen. 


Das Sichtvolumen spezifiziert den Teil des Weltkoordinatensystems, der auf den 
Bildschirm projiziert werden soll. Alle außerhalb des Sichtvolumens liegenden 
Objekte oder Objektteile werden nicht dargestellt. Für eine perspektivische 
Projektion wird das Sichtvolumen mit Hilfe des auf der Projektionsebene de- 
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finierten Fensters und PRP festgelegt: Das Sichtvolumen ist eine unendliche 
Pyramide mit Spitze im PRP, deren Seiten durch die Ecken des Fensters ver- 
laufen, siehe Abbildung 3.18. Hinter dem Projektionszentrum liegende Objekte 
liegen nicht in der Pyramide und werden daher auch nicht auf die Projekti- 
onsebene abgebildet. Für eine Parallel-Projektion wird das Sichtvolumen mit 
Hilfe der Projektionsrichtung DOP und dem Fenster auf der Projektionsebene 
festgelegt: Das Sichtvolumen ist ein unendliches Parallelepiped, dessen Seiten 
parallel zur Projektionsrichtung sind und die durch die Ecken des Fensters ver- 
laufen, vgl. Abbildung 3.17. Für rechtwinklige Parallelprojektionen stehen die 
Kanten des Sichtvolumens senkrecht auf der Projektionsebene. Um die Anzahl 
der auf dem Bildschirm dargestellten Objekte einzuschränken, und um bei einer 
perspektivischen Projektion weit entfernt liegende Objekte von der Darstellung 
auszuschließen, kann man die Sichtvolumen durch Angabe einer vorderen und 
einer hinteren Clip-Ebene endlich machen. Diese Ebenen liegen parallel zur 
Projektionsebene und werden durch Angabe ihres Abstandes von der Projekti- 
onsebenen spezifiziert, siehe Abbildung 3.17 und 3.18. B > 0 ist der Abstand 
der hinteren Clip-Ebene von der Projektionsebene, F < 0 ist der Abstand der 
vorderen Clip-Ebene von der Projektionsebene. 


Der Prozeß der Bildschirmdarstellung der im Weltkoordinatensystem definierten 
Objekte besteht im wesentlichen aus drei Schritten, vgl. Abbildung 3.19: Im 
ersten Schritt werden die Objekte bzgl. des Sichtvolumens abgeschnitten, im 
zweiten Schritt werden die verbleibenden Objektteile gemäß der spezifizierten 
Projektion auf die Projektionsebene abgebildet, im dritten Schritt wird der 
Inhalt des Fensters auf dem Bildschirm dargestellt. Man beachte, daß nach dem 
Abschneiden bzgl. des Sichtvolumens kein Abschneiden bzgl. der Fensterkanten 
mehr erforderlich ist, weil das Sichtvolumen entsprechend definiert wurde. Wir 
werden diesen Prozeß der Abbildung auf den Bildschirm im folgenden Abschnitt 
genauer beschreiben. 


3.6 Berechnung einer beliebigen Projektion 


Das Abschneiden der Objekte bzgl. des Sichtvolumens läßt sich prinzipiell da- 
durch realisieren, daß man für jedes Objekt die Schnittpunkte aller Seitenflächen 
und -kanten mit den Seitenflächen des Sichtvolumens berechnet und alle nicht 
innerhalb liegenden Teile wegschneidet. Die verbleibenden Objektteile werden 
dann auf die Projektionsebene abgebildet. Dies geschieht dadurch, daß man für 
jede Kante eines verbliebenen Objekts zwei Projektoren bestimmt, die durch 
die beiden Endpunkte der Kante verlaufen. Für perspektivische Projektionen 
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Abbildung 3.17: Sichtvolumen mit vorderer und hinterer Clip-Ebene für die schiefwink- 
lige Parallelprojektion. Sowohl vordere als auch hintere Clip-Ebene verlaufen parallel zur 
Projektionsebene. Die Seitenflächen des Sichtvolumens verlaufen parallel zur Richtung 
der Projektion DOP. Nur für eine rechtwinklige Parallelprojektion stehen die Seitenflächen 
senkrecht zur Projektionsebene. In diesem Fall ist das entstehende Sichtvolumen ein Qua- 
der. 
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Abbildung 3.18: Sichtvolumen mit vorderer und hinterer Clip-Ebene für die perspek- 
tivische Projektion. Sowohl vordere als auch hintere Clip-Ebene verlaufen parallel zur 
Projektionsebene. Die Seitenflächen des Sichtvolumens sind durch die durch die Kanten 
des Fenster auf der Projektionsebene und das Projektionszentrum verlaufenden Projekto- 
ren definiert. 


Clippen Abbildung Abbildung 
—> | bzgl. kan. —> | aufProj. ——- | aufden 

Sichtvol. ebene Bildschirm 
dreidi iönal zweidimensionale 
Weltkossdinaten Bildschirmkoordinaten 


Abbildung 3.19: Auszuführende Schritte bei der Darstellung von Objekten auf dem Bild- 
schirm: Die in Weltkoordinaten spezifizierten Objekte werden nach dem Clippen bzgl. des 
zugehörigen Sichtvolumens zuerst auf die Projektionsebene und dann auf den Bildschirm 
abgebildet. 
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sind diese Projektoren durch das Projektionszentrum PRP bestimmt, für paral- 
lele Projektionen durch die Richtung der Projektion DOP. Die Schnittpunkte 
der beiden Projektoren mit der Projektionsebenen geben die Endpunkte der 
Projektion der Kante an. 


Diese Vorgehensweise hat aber den Nachteil, daß sie viel Rechenzeit braucht. 
Eine effizientere Lösung läßt sich durch die Verwendung sogenannter kanoni- 
scher Sichtvolumen erreichen, für die die Schnittpunkte mit den Objekten ein- 
fach zu berechnen sind. Als kanonisches Sichtvolumen verwendet man bei einer 
Parallel-Projektion den Einheitswürfel, der von den Ebenen | 


z=0, z=1, y=(, y=1, z=(, z=1 (3.7) 


begrenzt ist. Für eine perspektivische Projektion verwendet man eine Einheits- 
pyramide, deren im Ursprung liegende Spitze abgeschnitten ist. Die begrenzen- 
den Ebenen sind 


r=2, r=-2z, y=2, y=-z, z=], zZ = Zmin (3.8) 


Dabei ist 0 <= zmin < 1. Bei Verwendung der kanonischen Sichtvolu- 
men müssen die spezifizierten Sichtvolumen zuerst in die kanonischen abge- 
bildet werden. Dies geschieht durch Anwendung sogenannter Normalisierungs- 
Transformationen Nyar und Nyer für Parallelprojektion bzw. perspektivische 
Projektion, die auf jedes Objekt der Szene angewendet werden müssen. Da- 
nach werden die Objekte bzgl. der kanonischen Sichtvolumen abgeschnitten 
und die verbleibenden Objektteile werden auf die Projektionsebene abgebildet. 
Diese Vorgehensweise hat den Vorteil, daß das Abschneiden bzgl. der kanoni- 
schen Sichtvolumen mit einem sehr efhizienten Algorithmus erfolgen kann, siehe 
Abschnitt 3.7. Auf der anderen Seite wendet man aber die Normalisierungs- 
Transformationen unter Umständen unnötigerweise auf Objekte an, die nach- 
folgend nicht weiter bearbeitet werden, weil sie nicht innerhalb des Sichtvo- 
lumens liegen. Üblicherweise überwiegt aber die durch das vereinfachte Clip- 
pen erzielte Einsparung an Laufzeit den Mehraufwand für das Anwenden der 
Normalisierungs-Transformationen auch in dem Fall, daß diese auf nicht ım 
Sichtvolumen liegende Objektteile angewendet werden. Bei Verwendung der 
kanonischen Sichtvolumen erreicht man die Darstellung der Objekte auf dem 
Bildschirm durch Ausführen der in Abbildung 3.20 wiedergegebene Schritte. 
Wir werden im folgenden die Normalisierungs-Transformationen für parallele 
und perspektivische Projektion herleiten. 
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Abbildung 3.20: Auszuführende Schritte bei der Darstellung von Objekten auf dem 
Bildschirm bei Verwendung von kanonischen Sichtvolumen. Npar und Nyer sind die 
Normalisierungs-Transformationen für parallele bzw. perspektivische Projektion. 


3.6.1 Normalisierungs-Transformation für parallele Pro- 
jektionen 


Die Normalisierungs-Transformation für Parallelprojektionen transformiert das 
spezifizierte Sichtvolumen in den durch die Gleichungen 3.7 festgelegten Ein- 
heitswürfel. Wir werden hier die Normalisierungs-Transformation für schief- 
winklige Parallelprojektionen herleiten. Diese beinhalten im Vergleich zur 
Normalisierungs-Transformation für rechtwinklige Parallelprojektionen eine 
zusätzliche Scherung, die die Projektionsrichtung DOP parallel zur z-Achse 
legt. Die Normalisierungs-Transformation wird durch Ausführen der folgenden 
linearen 'Transformationen realisiert: 


(1) VRP wird in den Ursprung verschoben. 

(2) Durch Rotationen um die y- und x-Achse wird der Normalenvektor VPN 
in Richtung der z-Achse gelegt. 

(3) Man rotiert um die z-Achse, so daß die Projektion VUP’ von VUP auf 
die Projektionsebene zur y-Achse wird. VUP’ ist die v-Achse des Koor- 
dinatensystems auf der Projektionsebene. Damit wird auch die u-Achse 
zur £-Achse. 

(4) Man führt eine Scherung aus, die die das Sichtvolumen definierenden Ebe- 
nen senkrecht zu den Koordinatenachsen stellt. Das Sichtvolumen ist nach 
dieser Transformation ein Quader. 

(5) Man verschiebt und skaliert diesen Quader so, daß der Einheitswürfel 
entsteht. 


In PHIGS werden die ersten drei Schritte in der Orientierungsmatriz (view- 
orientation matriz), die letzten zwei Schritte in der Abbildungsmatriz (view- 
mapping matrix) zusammengefaßt. 


Eine ähnliche Transformation wie die in Schritt (1) und (2) auszuführende 
wurde bei der Rotation um eine beliebige Achse verwendet, vgl. Abschnitt 
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3.3. Dort wurde der Richtungsvektor der Drehachse in Richtung der z- 
Achse gelegt. Hier muß der Normalenvektor der Projektionsebene in Richtung 
der z-Achse gelegt werden. Sei VPN’ der normalisierte Normalenvektor mit 
VPN’ = (n,,n,,n,)7, v = „/n2+n2 und VRP = (p,,Py,Ps,1)7. Aus den in 
Abschnitt 3.3 beschriebenen Matrizen ergeben sich die folgenden Matrizen: 


100 -p 
_[910-m 
T= 001 -m 
000 1 

n,/v 0 n,/v 0 

0 1009 

Ki = -n,/v 0 n,/v 0 

0 00 1 
10 00 
0 v —n, 0 
R=|o n, v0 
00 0 1 


Die Gesamttransformation von Schritt (1) und (2) ist 
Ra=R: RT 


Im dritten Schritt soll die u-Achse durch eine Rotation um die z-Achse par- 
allel zur z-Achse gelegt werden. Sei VUP = (u,uyu.)’. w= Yu2+u 
ist die Länge des Vektors VUP’, der durch Projektion von VUP entlang des 
Normalenvektors VPN auf die Projektionsebene entsteht und damit entlang 
der v-Achse des Koordinatensystems auf der Projektionsebene verläuft. ©3 
sei der Winkel zwischen VUP’ und der y-Achse. Dann ist cos; = u,/w 
und sin; = u,/w, vgl. Abbildung 3.21. Die gewünschte Drehung um die 
z-Achse mit dem Winkel ©; erhält man durch die Anwendung der folgenden 
Rotationsmatrix: 


u,/w -u,/w 0 0 
u./w u/w 00 

mo | re w 
0 0 10 


0 0 01 
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Abbildung 3.21: Blick auf die Pro- 
jektionsebene in Richtung negativer 
Uy vup z-Achse. Durch Rotation um die z- 


Achse wird VUP' so gedreht, daß es 
B in Richtung der y-Achse zeigt. 
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Abbildung 3.22: Blick auf das Sichtvolumen in Richtung positiver z-Achse vor und 
nach Anwendung der Scherung. 


Im vierten Schritt wird eine Scherung ausgeführt, die alle Seitenflächen des 
Sichtvolumens senkrecht zu den Koordinatenachsen stellt. Die nicht senkrecht 
zu einer Koordinatenachse stehenden Seitenflächen werden durch die Richtung 
der Projektion definiert. DOP’ = (di,d\,d;)? sei die Projektionsrichtung nach 
Ausführen der ersten drei Schritte, d.h. es ist 


DOP’=R;:R,:Rı,:-T-DOP 


Die Scherung ist in Abbildung 3.22 veranschaulicht. Nach Anwendung der 
Scherung soll für die Projektionsrichtung DOP” gelten: 


DOP” = SH, : DOP' = (0,0,d,1) 


Die Schermatrix 
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10 -d/d! 0 
fo1-d/d 0 
SHa=|o0 1 0 
000 ı 


realisiert diese Transformation. Es gilt nämlich: 


u I d; I u I d, I 
d. =d, 07 u =0 und d, =dy =, de = 0 


Durch die ersten vier Schritte ist das Sichtvolumen in einen Quader umge- 
formt worden. Dieser muß im folgenden noch mit einer Ecke in den Ursprung 
verschoben und so skaliert werden, daß ein Einheitswürfel entsteht. Seien im 
folgenden 


(Umin, Umin; F, 1)? 
(Umaz, Umaz, B, 1)" 


oa 8 
I 


die beiden äußeren Eckpunkte dieses Quaders, vgl. Abbildung 3.23. Die im 
fünften Schritt durchzuführende Translation von & in den Ursprung wird durch 
die folgende Translationsmatrix realisiert: 


T, = 


Die Skalierung zum Einheitswürfel wird von der folgenden Skalierungsmatrix 
durchgeführt: 


1 
— 0 0 0 
Umaz — Umin 1 
5 = 0 Umaxz — Umin 0 
0 0 — | 
B-F 


0 0 0 1 
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Abbildung 3.23: Sichtvolumen nach den 
ersten vier Transformationsschritten. Man 
beachte: Nach den erstem beiden Schrit- 
ten fällt die Projektionsebene mit der (zy)- 
Ebene zusammen. Die Rotation um die 
z-Achse im dritten Schritt ändert dies 
nicht. Weil die Scherung des vierten Schrit- 
tes weder 2z-Abstände allgemein, noch z- 
oder y-Abstände auf der Projektionsebene 
verändert, ist (Umin; tmin f) mit F< 0 
(Umin, Umin, F) der linke untere Endpunkt, (Umaz, Ymazı B) 
mit B > 0 der rechte obere Endpunkt des 
Quaders. 


(Umaz; Umazı B) 





Damit wird die gesamte Normalisierungs-Transformation durch die folgende 
Matrix N,ar beschrieben, die sich aus dem Produkt der Einzelmatrizen ergibt: 


Nyar = 5 Tr: SHyar Rs: Ra: Rı -T 


Npar transformiert das Sichtvolumen für eine beliebige Parallelprojektion in das 
zugehörige kanonische Sichtvolumen. Damit kann nach Anwendung von Nyar 
der in Abschnitt 3.7 beschriebene effiziente Algorithmus zum Clippen mit dem 
kanonischen Sichtvolumen verwendet werden. 


3.6.2 Normalisierungs-Transformation für perspektivi- 
sche Projektion 


Die Normalisierungs-Transformation Nyer für perspektivische Projektionen 
transformiert das spezifizierte Sichtvolumen in die durch die Gleichungen 3.8 
festgelegte Einheitspyramide. Die Normalisierungs-Iransformation wird durch 
Ausführen der folgenden linearen Transformationen realisiert: 


(1) VRP wird in den Ursprung verschoben. 

(2) Durch Rotationen um die y- und z-Achse wird der Normalenvektor VPN 
in Richtung der 2-Achse gelegt. 

(3) Man rotiert um die z-Achse, so daß die Projektion VUP’ von VUP auf 
die Projektionsebene zur y-Achse wird. VUP’ ist die v-Achse des Koor- 
dinatensystems auf der Projektionsebene. Damit wird auch die u-Achse 
zur x-Achse. 

(4) Man verschiebt das Projektionszentrum PRP in den Ursprung. 
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a Abbildung 3.24: Schnitt durch 
das Sichtvolumen vor Ausführung der 
Scherung. CW ist der Mittelpunkt 
des Fensters auf der Projektions- 
z ebene. Die z-Achse zeigt in die Zei- 
chenebene hinein. 


(5) Man führt eine Scherung aus, die die Mittellinie des Sichtvolumens mit 
der z-Achse zusammenfallen läßt. 
(6) Man skaliert das entstehende Sichtvolumen in die Einheitspyramide. 


Die Transformationen der Schritte (1), (2) und (3) sind identisch mit den Schrit- 
ten (1), (2) und (3) der Normalisierungs-Transformation für Parallelprojektio- 
nen. SeiPRP = (r,‚r,,rz,1)7. Dann wird die im vierten Schritt auszuführende 
Translation von PRP in den Ursprung durch die folgende Translationsmatrix 
erzielt: 


100 —r 
1010 -r, 
Rn=|oo01 r, 
000 1 


Man beachte, daß durch diesen Schritt der Referenzpunkt VRP auf der Pro- 
jektionsebene, der nach dem dritten Schritt noch im Ursprung lag, wieder von 
diesem weggeschoben wird. Die im fünften Schritt durchzuführende Scherung 
soll die Mittellinie der Pyramide mit der z2-Achse zusammenfallen lassen, siehe 
Abbildung 3.24. Die Mittellinie des Sichtvolumens verläuft durch das Projekti- 
onszentrum PRP und den Mittelpunkt des Fensters CW und fällt ı1.a. nicht mit 
der z-Achse zusammen. Die Koordinaten von CW im (uv)-Koordinatensystem 
sind: 


(Umin + Umaz) (Umin + Eu 


CWu= (eu, Cu) u ( 2 ’ 2 


Der Ursprung des (uv)-Koordinatensystems ist der Referenzpunkt VRP. Die- 
ser hat nach den Schritten (1) bis (4) den Wert: 


VRP' = (p,,p,,P,,1)" =T2- Rs: Ry-Rı-T- VRP 
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Für den Ortsvektor © des Fenstermittelpunktes CW = (c„,c,,c,,1)7 gilt: 


c D+on 
Prez + Py&y + P,& + Cueu + Cueı 
(p, + cu) + (p, + Je, + re 


Dabei ist 5’ = (p/,p},p,)" der Ortsvektor von VRP' bzgl. des Ursprungs des 
(zyz)-Koordinatensystems, &,, = (c„,c,)” ist der Ortsvektor von CW bzgl. des 
Ursprungs des (uv)-Koordinatensystems. &€,, €, und e, sind die Einheitsvek- 
toren im (zyz)-Koordinatensystem, e, und &, sind die Einheitsvektoren im 
(uv)-Koordinatensystem. Man beachte, daß die v-Achse wegen Schritt (3) 
parallel zur y-Achse liegt, die u-Achse liegt parallel zur x-Achse. Man hat 
also im (uv)-Koordinatensystem die gleichen Einheitsvektoren wie im (zyz)- 
Koordinatensystem und kann die Koordinatenwerte addieren. Also gilt für die 
(zyz)-Koordinaten des Fenstermittelpunktes CW: 


1 
C = pP, + 5) ‘ (Umin + Umaz) 


1 
4 - p, + r) ' (Umin + Umaz) 
gs = p 
Gesucht ist eine Scherung S Her, die CW in CW' = (0,0, p/,1)7 überführt, 


d.h. deren Anwendung auf den Fenstermittelpunkt CW’ als neuen Fenstermit- 
telpunkt liefert. Dies wird durch die Schermatrix 


10 5 0 

_ 0 ] 52 0 

SBe=|o010 

0001 

mit 

11 = _ Pet 2(min + Umar) 

Cz p\, 
5 u = Put 3(Umin + Umas) 

Cz p\ 


erreicht. Diese Schermatrix ist mit der für Parallelprojektionen verwendeten 
Schermatrix identisch: Die ersten drei Schritte sind ın beiden Transformati- 
onsfolgen gleich. Im vierten Schritt der Normalisierungstransformation für die 
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perspektivische Projektion wird zusätzlich PRP in den Ursprung verschoben. 
Bei der Parallelprojektion werden in der Schermatrix die Koordinatenwerte des 
Vektors DOP’ = CW’ — PRP’ verwendet, bei der perspektivischen Projek- 
tion werden die Koordinatenwerte des Ortsvektors © des Fenstermittelpunktes 
verwendet, für den nach der im vierten Schritt durchgeführten Translation um 
-PRP C= CW’-PRP' gilt. CW’ und PRP’ sind dabei die durch Anwendung 
der ersten drei Schritte auf CW und PRP erhaltenen Punkte. Dad= DOP' 


ist, sind die beiden Schermatrizen identisch. 


Der rechte obere Eckpunkt & = (a,,a,,a,,1)? des Fensters auf der Projektions- 
ebene hatte vor der Scherung die Koordinaten 


(pl, + Umaz: Py + Umazı P,; 1)? 


Die Anwendung der Scherung auf & liefert den Punkt @’ = (a,,a,,a,, 1)? mit 


Q_ 
| 


r 7 %trSsı'% 
1 
= pL + Umaz — (pl + 2 ‘ (Umin + Umaz)) 
1 


= (Umaz — Umin) 


2 
a, = ay +5S2'4z 
1 


— 2 ‘ (Umaz u Umin) 


! 
a = d,=P, 


Der linke untere Eckpunkt b = (b,, b,, b,,1)7 des Fensters hatte vor der Scherung 
die Koordinaten 


(pl, + Umin,P, + Umin, Pz 1)? 
Die Anwendung der Scherung auf b liefert den Punkt 5’ = (b/,,b',b',1)7 mit 


zı’yı 2) 


1 
bL = 2 ® (Umaz — Umin) 
= —_. (Omas — Umin) 
y zu 2 Mar mın 
= b= p, 


Das Fenster erstreckt sich also zentriert um den Punkt (u,v) = (0,0) der Pro- 
jektionsebene. Das Fenster umfaßt alle Punkte (u,v) der Projektionsebene, für 


die 
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Abbildung 3.25: Die linke Abbildung zeigt einen Schnitt durch das Sichtvolumen vor 
Anwendung der Skalierung. Die z-Achse zeigt in die Zeichenebene hinein. Die rechte Ab- 
bildung zeigt den Schnitt nach Anwendung der Skalierung. Die Gleichungen der sichtbaren 
Begrenzungsebenen sind angegeben. 


1 1 

= 5 ' (Umaz — Umin) SUS 5‘ (Umaz — Umin) 
1 1 

-2 (Omas = Umin) << 4 (Imae — Omi) 


gilt. Im letzten Schritt wird die nach dem fünften Schritt vorliegende, sym- 
metrische Pyramide mit Hilfe einer Skalierung in das kanonische Sichtvolumen 
umgeformt. Ein Blick auf das Sichtvolumen vor und nach der auszuführenden 
Skalierung ist in Abbildung 3.25 wiedergegeben. Die Skalierung erfolgt in zwei 
Schritten. Zuerst wird in x- und y-Richtung so skaliert, daß die seitlichen Be- 
grenzungsebenen die Steigung 1 haben. Dies erreicht man dadurch, daß man 
die &- und y-Komponente der Begrenzungspunkte @’ und b ' des Fensters so 
skaliert, daß sie den Wert p/ erhalten. Die zugehörige Skalierungsmatrix ist 


2 I 
ii: 7000 00 
Umaz — Umin 2 , 
Pz 
91 = ı Umaz — Umin 02 
0 0 10 


0 0 


em) 
[Sur 
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Danach wird in z-Richtung so skaliert, daß die hintere Clip-Ebene z = p, + B 
zur Ebene z = 1 wird. Dies erreicht man durch Skalierung mit dem Faktor 
1/(p, + B). Damit die Steigungen der anderen Begrenzungsebenen erhalten 
bleiben, wird auch in z- und y-Richtung skaliert. Es ergibt sich die Skalie- 
rungsmatrix 








00 
p,+B 
0 00 
5, = p, + B j 
0 0 0 
p,+B 
0 0 0 1 


Die Anwendung dieser Matrix transformiert die vordere Clip-Ebene in 





z=mn=t + F 
MIN pi + B 
und die Projektionsebene in 
P; 
z — 0; u en 
it y+B 


Die gesamte Normalisierungs-Transformation für perspektivische Projektionen 
ist also 


Nper = 5251 SHper Ta Ra Ra Rı T 


Man beachte, daß alle an den Normalisierungs-Transformationen beteiligten 
Transformationen die vierte Komponente der Punkte in homogenen Koordina- 
ten, auf die sie angewendet werden, unverändert lassen. Das gilt auch für die 
Normalisierungs-Transformation der Parallelprojektionen. Da wir annehmen, 
daß vor Anwendung der Normalisierungs-Transformationen die vierte Kompo- 
nente den Wert 1 hat, vgl. Abschnitt 3.2, muß keine Division durch den in der 
vierten Komponente stehenden Skalierungsfaktor durchgeführt werden, um die 
kartesischen Koordinaten zu errechnen. 
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3.7 CJlippen bzgl. der kanonischen Sichtvolu- 
men 


Nach Anwenden der Normalisierungs-Transformation auf die darzustellenden 
Objekte müssen diese bzgl. der kanonischen Sichtvolumen abgeschnitten wer- 
den. Dazu kann man eine Verallgemeinerung des Algorithmus von Cohen und 
Sutherland verwenden, vgl. Abschnitt 2.4.1: Anstatt eines 4-Bit-Binärcodes 
verwendet man einen 6-Bit-Binärcode, wobei die einzelnen Bits bei dem kano- 
nischen Sichtvolumen für Parallelprojektionen die folgende Bedeutung haben: 


Bit 5: gesetzt für Punkte (z,y,z) oberhalb des Sichtvol.,d.h. wenn y>1 


Bit 4: gesetzt für Punkte (z,y,z) unterhalb des Sichtvol., d.h. wenn y<0 
Bit 3: gesetzt für Punkte (z,y,z) rechts des Sichtvol., d.h. wenn z>]1 
Bit 2: gesetzt für Punkte (z,y,z) links des Sichtvol., d.h. wenn z<0 
Bit 1: gesetzt für Punkte (z,y,z) hinter dem Sichtvol., d.h. wenn z>1 
Bit 0: gesetzt für Punkte (z,y,z) vor dem Sichtvol., d.h. wenn z<0 


Wie im zweidimensionalen Fall liegt ein zu einem Objekt gehörendes Geraden- 
segment ganz innerhalb des Sichtvolumens, wenn seine beiden Endpunkte den 
Binärcode 000000 haben. Wenn die bitweise Und-Operation der Binärcodes 
der beiden Endpunkte einen Wert ungleich Null ergibt, liegen beide Endpunkte 
und damit auch das Geradensegment außerhalb des Sichtvolumens. Wenn keine 
der beiden Bedingungen erfüllt ist, wird die in Abschnitt 2.4.1 beschriebene re- 
kursive Unterteilung angewendet. Maximal werden sechs Unterteilungen des 
Geradensegmentes vorgenommen, eine für jede Seitenfläche des Sichtvolumens. 
Bei der rekursiven Unterteilung müssen die Schnittpunkte des betrachteten Ge- 
radensegmentes s mit den Seitenflächen des Sichtvolumens bestimmt werden. 
Dazu benutzt man die Parameterdarstellung von s: wenn ä = (a,,a,,a,)” und 
b= (b,, b,,bz)7 die beiden Endpunkte von s sind,.lautet diese 


s=ä+u(lb-ä) mit0O<u<sI (3.9) 


Den Schnittpunkt mit der Seitenfläche y = 1 erhält man, indem man aus der 
y-Komponente 


l=a,+u(b,-a,) 
dieser Gleichung den Parameter u bestimmt: 


un 
y4y 
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Wenn u nicht zwischen 0 und 1 liegt, liegt der gefundene Schnittpunkt nicht 
auf s und ist nicht von Interesse. Wenn u zwischen 0 und 1 liegt, wird der 
genaue Schnittpunkt durch Einsetzen von u in die z- und y-Komponente von 
Gleichung (3.9) ermittelt und dazu benutzt, s aufzuteilen. Die Berechnung des 
Schnittpunktes mit anderen Seitenflächen erfolgt analog. 


Auch zum Clippen bzgl. des kanonischen Sichtvolumens für perspektivische Pro- 
jektionen kann der Algorithmus von Cohen & Sutherland benutzt werden. Die 
verwendeten 6-Bit-Binärcodes haben dabei die folgende Bedeutung: 


Bit 5: gesetzt für Punkte (z,y,z) oberhalb des Sichtvol.,d.h. für y>z 


Bit 4: gesetzt für Punkte (z,y,z) unterhalb des Sichtvol., d.h. für y<-z 
Bit 3: gesetzt für Punkte (x,y,z) rechts des Sichtvol., d.h. für 2>z 
Bit 2: gesetzt für Punkte (z,y,z) links des Sichtvol., d.h. für e<-z 
Bit 1: gesetzt für Punkte (z,y,z) hinter dem Sichtvol., d.h. für z>|1 
Bit 0: gesetzt für Punkte (z,y,z) vor dem Sichtvol., d.h. für Z< Zmin 


Der Algorithmus läuft genauso ab wie für das Clippen bzgl. des Sichtvolumens- 
für Parallelprojektionen. Zur Berechnung des Schnittpunktes eines Geraden- 
segmentes s mit der oberer Begrenzungsebene y = z des Sichtvolumens werden 
die y- und z2-Komponenten der Geradengleichung gleichgesetzt: 


tu (= n)=a tu (be —a,) 


Daraus ergibt sich für x: 


Den genauen Schnittpunkt erhält man in dem Fall, daß u zwischen 0 und 1 liegt, 
durch Einsetzen des Wertes in die &- und y-Komponente von Gleichung (3.9). 
Die Berechnung des Schnittpunktes mit anderen Seitenflächen erfolgt analog. 


Man sieht, daß die Schnittpunktberechnung bei Verwendung der kanonischen 
Sichtvolumen sowohl für Parallelprojektionen als auch für perspektivische Pro- 
jektionen im Vergleich zur Schnittpunktberechnung im allgemeinen Fall we- 
nig Rechenzeit braucht. Dies ist wichtig, weil üblicherweise sehr viele Objekte 
bzgl. der Sichtvolumen abgeschnitten werden müssen. 


Nach dem Clippen werden die innerhalb des kanonischen Sichtvolumens lie- 
genden Objektteile mit Hilfe der gewünschten Projektion, beschrieben durch 
die Matrizen (3.4), (3.5) oder (3.6), auf die Projektionsebene abgebildet. In 
PHIGS hat der Programmierer die Möglichkeit, einen Sichtausschnitt (view- 
port) zu definieren. Das ist ein rechteckiger Bereich, der so zu wählen ist, 
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daß er innerhalb des kanonischen Sichtvolumens für Parallelprojektionen liegt. 
Für perspektivische Projektionen muß daher das kanonische Sichtvolumen noch 
in das kanonische Sichtvolumen für Parallelprojektionen transformiert werden. 
Dies wird für zmin # 1 durch die folgende Matrix M beschrieben: 





20 0 12 
0 ı2 0 12 
M u 0 0 Brurn nn 
0 0 1 0 


M entsteht durch Hintereinanderausführen dreier Einzelmatrizen Mı, $S und T: 





10 0 0 

0 1 0 0 
M, — —Zmin 

0 0 em 1l-Zmin 

0 0 0 


beschreibt die Transformation des kanonischen Sichtvolumens für die perspek- 
tivische Projektion in ein Volumen, das durch die Ebenen 


s=-l, z<=1|l, y=-l, y=|, z=(0, z=]1 
begrenzt wird, vgl. Abbildung 3.26. 


1/72 0 
_| 0° U 
S=| oo 
00 


DD 
SORoOo0o0 
"=oo6o0 


beschreibt eine Skalierung in x- und y-Richtung um 1/2, die dieses Volumen 
in einen Würfel mit der Kantenlänge 1 transformiert. T = T(1/2,1/2,0) ver- 
schiebt den Einheitswürfel so, daß er mit einem Eckpunkt im Ursprung liegt. 


Der zu definierende Sichtbereich wird wieder durch zwei Punkte (£min, Ymin, Zmin) 
und (Lmaz, Ymazı Zmaz) spezifiziert, analog Abbildung 3.23. In PHIGS wird der 
Inhalt des Sichtbereichs dadurch auf dem Bildschirm dargestellt, daß der Ein- 
heitswürfel auf das größte auf dem Bildschirm darstellbare Quadrat abgebildet 


6Die Kombination vom M mit Nyer gestattet es, alle Clip-Operationen bzgl. des kanoni- 
schen Sichtvolumens für Parallelprojektionen auszuführen. 
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y 
y (1,1) (1,1) 


(1,1) (1-1) 


Abbildung 3.26: Zur Tranformation des kanonischen Sichtvolumens für perspektivische 
Projektion in das kanonische Sichtvolumen für Parallelprojektion. 


wird. Zur Darstellung der Objekte wird einfach die z-Komponente weggelas- 
sen. Die Abbildung des kanonischen Sichtvolumens für Parallelprojektionen in 
den Sichtbereich wird durch die Skalierungsmatrix 


$ (Imaz — Imin’, Ymax — Ymin, Zmax Zmin) 


erreicht. Der Sichtbereich wird dann mit der Translation T(£min, Ymin, Zmin) IN 
die linke untere Ecke des kanonischen Sichtvolumens geschoben. 


Kapitel 4 


Bestimmung sichtbarer 
Oberflächen 


Im letzten Kapitel haben wir implizit angenommen, daß die darzustellenden 
Objekte durch ebene Polygone definiert werden, die einzeln auf die Projekti- 
onsebene abgebildet, werden, indem ihre Kanten nach dem Clippen bzgl. der 
kanonischen Sichtvolumen auf die Projektionsebene projiziert werden. Dies 
führt dazu, daß die Objekte als Drahtgitterobjekte auf dem Bildschirm darge- 
stellt werden. Sofern sie innerhalb des Sichtvolumens liegen, werden alle Teile 
aller Objekte auf dem Bildschirm dargestellt. Die Tatsache, daß Teile eines 
Objektes von anderen Objekten oder von anderen Teiles des gleiches Objektes 
verdeckt sein können, wird in der Bildschirmdarstellung nicht wiedergegeben. 


Wir werden uns in diesem Kapitel mit der Frage beschäftigen, wie man für 
eine gegebene Szene, d.h. für eine Ansammlung von Objekten, die sichtbaren 
Kanten oder Oberflächen bestimmt. Dieser Prozeß wird auch als “Eliminie- 
rung verborgener Kanten” oder “Oberflächen” bezeichnet. Von Kanten ist 
dabei meist im Zusammenhang mit Drahtgitterobjekten die Rede. Wir ver- 
wenden hier den Begriff “Bestimmung sichtbarer Oberflächen”, weil wir in den 
nachfolgenden Kapiteln davon ausgehen, daß die darzustellenden Objekte be- 
stimmte Oberflächeneigenschaften haben, die bei der Darstellung berücksich- 
tigt werden und die z.B. festlegen, ob das darzustellende Objekt matt oder 
spiegelnd, transparent oder undurchsichtig dargestellt wird. Eine genaue Be- 
schreibung der Festlegung der Oberflächeneigenschaften von Objekten findet 
man im nächsten Kapitel. Eine Behandlung der Darstellung von Objekten mit 
gekrümmten Oberflächen findet man in Kapitel 7. 


In [SSS74] werden die Algorithmen zur Bestimmung sichtbarer Oberflächen in 
zwei Klassen unterteilt: Die erste Klasse umfaßt die im Bildraum arbeiten- 
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den Algorithmen, die für jedes Pixel der zu erzeugenden Bildschirmdarstel- 
lung bestimmen, welches der darzustellenden Objekte sichtbar ist. Das Pixel 
wird mit der Farbe des sichtbaren Objektes dargestellt. Das sichtbare Ob- 
jekt kann durch Berechnung des Schnittpunktes zwischen dem Projektor, der 
durch das betrachtete Pixel und das Projektionszentrum (perspektivische Pro- 
jektion) bzw. die Projektionsrichtung (Parallelprojektion) festgelegt ist, und 
den Objekten bestimmt werden. Der am nächsten zur Projektionsebene lie- 
gende Schnittpunkt bestimmt das sichtbare Objekt. Prinzipiell muß bei diesem 
Ansatz für jedes Pixel der Schnittpunkt des zugehörigen Projektors mit al- 
len zu Objekten gehörenden Polygonen bestimmt werden. Bei p Pixeln und 
n Polygonen resultiert daraus eine Laufzeit von O(p  n). Die zweite Klasse 
umfaßt die im Objektraum arbeitenden Algorithmen, die für jedes Polygon P, 
das zur Beschreibung eines Objektes verwendet wird, bestimmen, welcher Teil 
von P sichtbar ist. Dies kann z.B. dadurch realisiert werden, daß jedes Polygon 
mit allen anderen Polygonen geschnitten wird und die resultierenden Teilpo- 
lygone bzgl. ihres Abstandes von der Projektionsebene miteinander verglichen 
werden. Dies resultiert in einer Laufzeit von O(n?). Obwohl üblicherweise 
p> n ist, kann daraus nicht a priori geschlossen werden, daß die im Objek- 
traum arbeitenden Algorithmen eine geringere Laufzeit als die im Bildraum 
arbeitenden haben. Dies liegt daran, daß üblicherweise die Laufzeit der einzel- 
nen Schritte für die im Objektraum arbeitenden Algorithmen größer ist. Ein 
weiterer Unterschied zwischen den beiden Klassen besteht darin, daß die im 
Objektraum arbeitenden Algorithmen die sichtbaren Polygonteile unabhängig 
von der Auflösung des verwendeten Bildschirms bestimmen. Erst nach Be- 
stimmung der sichtbaren Polygonteile werden diese auf dem Bildschirm mit 
der gewünschten Auflösung dargestellt. Bei Darstellung auf einem Bildschirm 
mit anderer Auflösung braucht nur dieser letzte Schritt wiederholt zu werden. 
Bei den im Bildraum arbeitenden Algorithmen ist dagegen eine vollständige 
Neuberechnung erforderlich. 


Eine andere Möglichkeit der Klassifizierung der Algorithmen zur Bestimmung 
der sichtbaren Oberflächen besteht ın der Unterscheidung, ob und welche Art 
von Kohärenz benutzt wird. Mit dem Begriff Kohärenz wird allgemein der 
räumliche oder zeitliche Zusammenhang von Dingen bezeichnet. Laut [SSS74] 
und [FvDFH90] können für die Bestimmung sichtbarer Oberflächen verschie- 
dene Formen von Kohärenz ausgenutzt werden, unter anderen Objektkohärenz, 
Kantenkohärenz, Flächenkohärenz und Scangeraden-Kohärenz. Wir werden bei 
der Beschreibung der Algorithmen darauf hinweisen, welche Form von Kohärenz 
ausgenutzt wird. 
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4.1 Sichtbare Oberflächen für konvexe Ob- 
jekte 


Wir werden in diesem Abschnitt zuerst einen sehr einfachen Spezialfall unter- 
suchen: die Bestimmung der sichtbaren Oberflächen für ein einzelnes konvexes 
Objekt, vgl. auch [BG89].indexkonvexes Objekt Ein Objekt heißt konver, wenn 
jede gradlinige Verbindung zwischen zwei innerhalb des Objektes liegenden 
Punkten vollständig innerhalb des Objektes liegt. Man kann sich ein poly- 
gonales konvexes Objekt entstanden denken als Schnitt der Ebenen, die die 
Oberflächen des Objektes enthalten. Jede dieser Ebenen teilt den dreidimen- 
sionalen Raum in zwei Halbräume. Einer dieser beiden Halbräume enthält das 
Objekt und wird innen genannt, der andere liegt außen. Das konvexe Objekt 
ist der Schnitt aller inneren Halbräume der Oberflächen des Objektes. Eine 
Oberfläche eines einzelnen konvexen Objektes ist für eine gegebene Projekti- 
onsspezifikation entweder ganz sichtbar oder ganz unsichtbar. Da die nicht 
sichtbaren Oberflächen vom Objekt selbst verborgen werden, nennt man sie 
selbst-verborgen. Es ist nicht möglich, daß eine Oberfläche eine andere nur teil- 
weise verdeckt. Damit braucht für eine Oberfläche P eines konvexen Objektes 
nur bestimmt zu werden, ob diese sichtbar ist oder nicht. Dies kann mit Hilfe 
des äußeren Normalenvektors ü(P) erfolgen, der senkrecht auf P steht und vom 
Inneren des Objektes weg zeigt, vgl. Abbildung 4.1. Wenn n(P) in Richtung des 
Betrachters zeigt, d.h. in Richtung des Projektionszentrums für perspektivische 
Projektionen bzw. in negativer Projektionsrichtung für Parallelprojektionen, ist 
P mitsamt seiner Begrenzungskanten sichtbar. Wenn ü(P) vom Betrachter weg 
zeigt, ist P nicht sichtbar. Wir nehmen im folgenden an, daß eine perspekti- 
vische Projektion vorliegt und daß das Projektionszentrum im Ursprung liegt. 
Ob fü(P) in Richtung des Betrachters zeigt oder nicht, bestimmt man wie folgt: 
Wenn ö = (v,,vy,v,)” ein auf P liegender Punkt ist, ist —Ö der von v zum im 
Ursprung liegenden Projektionszentrum zeigende Richtungsvektor. P ist genau 
dann sichtbar, wenn der Winkel zwischen n(P) und —ö spitz ist, d.h. wenn gilt: 


-|ö] - jäl - cos(d,r) 
= (VE NE tYyny+V%n,)>0 (4.1) 


| 
Sı 
Sı 
| 


Mit P sind auch alle Kanten von P sichtbar. Wenn n(P)-ö = 0, liegt ein Winkel 
von 90° vor und es ist nur eine Seitenkante von P sichtbar. Diese braucht nicht 
dargestellt zu werden, weil sie mit einer sichtbaren Oberfläche Q # P geteilt 
wird. 
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Abbildung 4.1: Bestimmung der selbst-verborgenen Oberflächen für ein konvexes Ob- 
jekt. Die Abbildung zeigt eine zweidimensionale Veranschaulichung. Für die sichtbaren 
Oberflächen ist die Verbindung zwischen einem beliebigen Punkt auf der Oberfläche 
und dem im Ursprung liegenden Projektionszentrum gepunktet eingezeichnet. Diese 
Oberflächen sind sichtbar, weil der Winkel zwischen diesem Verbindungsvektor und dem 
Normalenvektor spitz ist. 
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Den Normalenvektor einer Oberfläche P kann man aus drei auf P liegenden 
Punkten 0,,02,03 durch Bildung des Kreuzproduktes 


r(P)= (%-0) x (ö -0ı) 


berechnen. 01,02,03 können z.B. Eckpunkte von P sein. Ob das so bestimmte 
rn(.P) der äußere oder der innere Normalenvektor ist, kann man mit Hilfe eines 
innerhalb des Objektes liegenden Punktes @ bestimmen. Wenn ä ein innerhalb 
von P liegender Punkt ist, zeigt der Vektor ö, — @ in Richtung der Außenseite 
von P. n(P) ist der gesuchte äußere Normalenvektor, wenn n(P) mit d, — & 
einen spitzen Winkel bildet, d.h. wenn n(P)-(öı -&) > 0. Ansonsten ist -n(P) 
der äußere Normalenvektor. 


Für ein konvexes Objekt erhält man einen innerhalb des Objektes liegenden 
Punkt durch Berechnung des arithmetischen Mittels aller Eckpunkte des Objek- 
tes, d.h. aller Knoten von Polygonen, die Oberflächen des Objektes definieren. 
Wenn dj,‘ ,d„ diese Knoten sind, ist 


der gesuchte Punkt. Man beachte, daß dies eine affine Kombination der Punkte 
Ü,',dn mit; = 1/n ist. 

Obwohl der gerade vorgestellte Spezialfall nur in sehr wenigen praktischen 
Fällen einsetzbar erscheint, kann die Bestimmung der selbst-verborgenen 
Oberflächen dazu verwendet werden, für allgemeine Szenen die Anzahl der zu 
betrachtenden Polygone zu reduzieren. Eine selbst-verborgene Oberfläche ei- 
nes Objektes O kann keine Oberfläche eines anderen Objektes verdecken, die 
nicht schon von einer nicht selbst-verborgenen Oberfläche von O verdeckt wird. 
Wenn keine mehrfachen Reflexionen betrachtet werden, haben deshalb die 
selbst-verborgenen Oberflächen keinen Einfluß auf die Darstellung der Szene 
und können in einem Vorauswahl-Schritt eliminiert werden. 


4.2 Sichtbare Kanten für eine allgemeine 
Szene 


Wir werden in diesem Abschnitt einen Algorithmus vorstellen, vgl. [BG89], 
der für eine aus undurchsichtigen Objekten bestehende Szene die sichtbaren 
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Kanten berechnet. Der Algorithmus macht keinerlei Annahmen über das Aus- 
sehen und die Lage der darzustellenden Objekte und ist im Gegensatz zu den 
in den folgenden Abschnitten vorgestellten Algorithmen sowohl für Vektor- als 
auch für Rastergraphiksysteme verwendbar. Wir werden zwar aus Gründen der 
Übersichtlichkeit zuerst annehmen, daß die darzustellenden Objekte sich nicht 
gegenseitig durchdringen, werden aber später skizzieren, wie man auch diesen 


Fall behandelt. 


Für eine Ansammlung von nicht konvexen Objekten ist es möglich, daß Kanten 
eines Objektes von den Oberflächen anderer Objekte teilweise verdeckt sein 
können. Für die Darstellung auf dem Bildschirm müssen also sichtbare Teile 
von Kanten berechnet werden. Der Algorithmus tut dies in zwei Schritten. Im 
ersten Schritt unterteilt er die Kanten aller Objekte in Kantensegmente, die 
entweder ganz sichtbar oder ganz unsichtbar sind und bestimmt im zweiten 
Schritt für jedes Kantensegment, ob dieses sichtbar ist oder nicht. 


Der erste Schritt arbeitet im Bildraum, d.h. auf dem auf der Projektionsebene 
definierten Fenster. Die darzustellenden Objekte werden bzgl. des Sichtvolu- 
mens abgeschnitten und die Kanten der verbleibenden Teile werden auf das 
Projektionsfenster abgebildet. Zu jeder projizierten Kante merkt man sich die 
zugehörige Oberfläche. Die Kanten von selbst-verborgenen Oberflächen können 
mit dem im letzten Abschnitt beschriebenen Verfahren vor der Projektion eli- 
miniert werden. Jede Kante ist durch ihre beiden Endpunkte definiert. 


Nach der Projektion werden für jede projizierte Kante alle Schnittpunkte mit 
den projizierten Kanten aller anderen Polygone berechnet. Die Schnittpunkte 
mit Kanten der gleichen Oberfläche brauchen nicht berechnet zu werden, weil 
diese Kanten sich nur an den Enden schneiden können. Die Schnittpunkte 
mit Kanten anderer Oberflächen des gleichen Objektes müssen dagegen be- 
rechnet werden, weil konkave Objekte sich selbst teilweise verdecken können. 
Die Laufzeit dieses Schrittes für n Kanten beträgt O(n?), wenn man den nai- 
ven Ansatz verwendet, der für jede Kante die Schnittpunkte mit allen anderen 
Kanten berechnet. Wenn die Anzahl s der Schnittpunkte wesentlich kleiner 
als die Anzahl der Geradensegmente ist, d.h. s < n, kann die Laufzeit durch 
Verwendung eines Scangeraden-Verfahrens auf O((s + n)logn) gedrückt wer- 
den, vgl. z.B. [Meh84a].! Die Schnittpunkte werden durch die zugehörigen 
Parameterwerte der Geradengleichungen der projizierten Kanten repräsentiert. 
k sei eine Kante eines Objektes mit den Endpunkten fı = (zı,Yy1,2ı) und 


!In [CE88] findet man einen - allerdings recht komplizierten — Algorithmus mit der theo- 
retisch optimalen Laufzeit O(s + nlogn). Der Algorithmus ist eine Mischung verschiede- 
ner Verfahren und Datenstrukturen wie Scangeraden-Methode, Segmentbäume, topologisches 
Scanverfahren usw. Ein Einsatz im vorliegenden Fall wird sich aber wegen des großen Ver- 
waltungsaufwandes des Verfahrens nur in den seltensten Fällen lohnen. 
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P2 = (£2,Y2,22). k’ sei die Projektion von k mit den Endpunkten #4 und p%. 
Dann ist 


K=dtn(n-H) 0O<u<iı 


die Parametergleichung von k’. Die Schnittpunkte von k’ mit den anderen 
projizierten Kanten werden durch die Parameterwerte a1,‘ nk) dargestellt, 
die aufsteigend sortiert seien: 


<pıSStna) SI 


Diese Parameterwerte werden in einer sortierten Liste abgelegt, die für jede 
Kante gesondert gehalten wird. Die Parameterwerte unterteilen die Kante k 
in n(k) + 1 Kantensegmente. Jedes dieser Kantensegmente ist entweder voll- 
kommen sichtbar oder vollkommen unsichtbar, weil die Sichtbarkeit sich nur an 
Kreuzungspunkten mit den Projektionen anderen Kanten ändern kann. 


Im zweiten Schritt wird für jedes Kantensegment bestimmt, ob dieses sicht- 
bar ist. Dabei reicht es aus, einen beliebigen Punkt des Kantensegmentes zu 
untersuchen, z.B. den Mittelpunkt. Für das zwischen u; und wi+ı liegende 
Kantensegment von k’ wird der Mittelpunkt m’ durch den Parameterwert 


1 
= (mi + Bir) 


bestimmt. Es gilt: 


m=Atnd-A) 


m! ıst der Mittelpunkt des in der Projektionsebene liegenden Kantensegments 
von k’. Wir nehmen hier an, daß eine perspektivische Projektion verwendet 
wird, daß das Projektionszentrum im Ursprung liegt und daß die Projektions- 
ebene Abstand d vom Ursprung hat. Da die Projektionsmatrizen singulär sind, 
vgl. Abschnitt 3.4, kann eine Projektion nicht durch Invertieren der zugehörigen 
Matrix rückgängig gemacht werden. Statt dessen bestimmt man den Punkt m 
der ursprünglichen Kante k im Objektraum, der auf m’ projiziert wird, durch 
Rückwärtsprojektion. 


Sei 5’ ein beliebiger auf k’ liegender Punkt. Den zugehörigen Punkt auf k 
findet man durch Berechnung des Schnittpunktes zwischen dem Projektor /, der 
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Projektionsebene 


Abbildung 4.2: Veranschaulichung der Rückwärtsprojektion zur Bestimmung des Punk- 
tes 5 im Objektraum, der zu einem auf der Projektionsebene liegenden Punkt 5’ gehört. 


durch das Projektionszentrum und 5’ verläuft, und der ursprünglichen Kante k, 


vgl. Abbildung 4.2. Wenn 


B = Bi+r--D) (2) 
l= v.f (4.3) 
k = Pıtu (PR -Pı) (4.4) 


erhält man den Schnittpunkt zwischen ! und k durch Einsetzen von (4.2) in 
(4.3) und Gleichsetzen von (4.3) und (4.4): 


v(At+tr (BR -PA)-htu (BR -H) 


p ist bekannt, u und v sind unbekannt. Nach (3.3) gilt für die perspektivische 
Projektion: 


Einsetzen liefert: 


vd 4 -D)=n+u (A-9) (4.5) 


D1 
2] 
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Die z-Komponente dieser Gleichung ist: 
v-d=zı+ulz - 2ı) 


Auflösen nach v und Einsetzen in (4.5) liefert: 


zZ z 
u(p -1)pı - plu - 1) 2.Ps + p(u -1)pı - ulp - pi =0 (46) 


Diese Gleichung gilt für beliebige Punkte 5ı und #», also auch für Punkte mit 
den z-Komponenten zı = 1 bzw. za = 0. Einsetzen dieser Werte in die x- 
Komponente von Gleichung (4.6) liefert: 


Pu) -up-1)=0 


Daraus erhält man 
p21 


ha -n)+2 
Man beachte, daß diese Gleichung unabhängig von d und den z- und y- 


Komponenten der Kantenendpunkte ist. Daß (4.7) für beliebige Punkte gilt, 
kann durch Einsetzen in (4.6) verifiziert werden. 


(4.7) 


Wir wollen hier das Verfahren der Rückwärtsprojektion anwenden, um den 
Punkt m = (m,,m,,m,)?! auf k zu bestimmen, der auf m’ projiziert wird. 
o,; sei der Parameterwert von m’. Dann ist 


m=mht+tu (PR -Pı) 

mit 
0,21 

u= 
o(a1-2)+2 
Wenn m von einer Oberfläche, die k nicht enthält, verdeckt wird, ist m und 
damit auch k nicht sichtbar. Ansonsten ist m und damit auch k sichtbar. 
Ob m von einer Oberfläche verdeckt wird, stellt man durch Untersuchung des 
Projektors © = am fest, der vom Projektionszentrum ausgehend durch m’ und 
m verläuft. Man bestimmt den Schnittpunkt von ö mit allen Oberflächen, die k 


nicht als Begrenzungskante enthalten. Sei P ein Polygon mit Normalenvektor rn, 
das eine solche Oberfläche definiert. do sei ein Eckpunkt von P, vgl. Abbildung 
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Abbildung 4.3: Anwendung der Rückwärtsprojektion 


4.3. Der Projektor w schneidet die Ebene, in der P liegt, in einem Punkt %, 
mit 


Es gilt: 


Also : 


a; kann durch Auflösung dieser Gleichung nach a; bestimmt werden. Es lassen 
sich drei Fälle unterscheiden: 


1. Wenn a; > 1 ist, liegt die Oberfläche hinter der betrachteten Kante k und 
verdeckt diese somit nicht. 


2. Wenn &; < Zmin/M; ist, ist die z-Komponente des Schnittpunktes kleiner 
als Zmin, der Schnittpunkt liegt also vor der vorderen Clip-Ebene und 
kann unbetrachtet bleiben, das Kantensegment ist also sichtbar. 
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3. Wenn a; zwischen Zmin/m,; und 1 liegt, muß getestet werden, ob der 
Schnittpunkt %; innerhalb von P liegt oder nicht. Wenn ®; innerhalb 
von P liegt, verdeckt P das Kantensegment und dieses braucht nicht dar- 
gestellt zu werden. Wenn w; außerhalb von P liegt, so verdeckt P das 
Kantensegment nicht. 


Um im dritten Fall festzustellen, ob w; innerhalb von P liegt, verwenden wir 
den sogenannten Strahltest: Wir senden von ü; einen Strahl aus, der innerhalb 
der Ebene von P verläuft und der P schneidet. Ansonsten kann der Strahl eine 
beliebige Richtung haben. Wenn die Anzahl der Schnittpunkte des Strahles 
mit P gerade ist, liegt W,; außerhalb von P, sonst liegt ©; innerhalb von P. Der 
Strahltest kann auch auf der Projektion P’ von P durchgeführt werden. Für P’ 
ist der Test weniger rechenzeitaufwendig, weil er im (uv)-Koordinatensystem 
der Projektionsebene ausgeführt werden kann. Abbildung 4.4 zeigt eine Pro- 
grammskizze des gerade beschriebenen Algorithmus.? 


2Wir stellen in diesem Kapitel in den Programmskizzen Polygone und deren Kanten als 
Datentyp int dar. Die zugehörigen Werte sind als Indizes in geeignete Datenstrukturen zu 
interpretieren, die eine genaue Beschreibung enthalten. 
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void scan _hidden surface(); 


float alpha; int i,j,p,visible; 
POINT s,m,b; 


eliminate self hidden(); clip _and_ project(); 
for (i=0; i<number_of_edges(); i++) do { 
insert (i,endpoints(i)); 
for (j=0; j<i; j++) do 
if (!same polygon(i,j)) { 
s = intersect(i,j); insert(i,s); 
} 


(i=0; i<number_of_segments(); i++) do { 
m = compute midpoint(i); b = back project (m); 
visible = 1; 
for (p=0; p<number_of_ polygons(); p++) do 
if (!belongsto(i,p)){ 
s = intersect_projector(b,p); 
alpha = param(s,b); 
if ((alpha > 1) || (alpha < zmin/z(m)) ; 
else if (inside(s,p)) visible = 0; 


} 


if (visible) display(i); 
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Abbildung 4.4: Programmskizze zum Bestimmung der sichtbaren Kanten für eine allge- 
meine Szene. eliminate_ self _hidden() eliminiert die selbst-verborgenen Oberflächen 
der Objekte. clip_and_project() schneidet die Kanten der verbleibenden Polygone 
bzgl. des Sichtvolumens ab und projiziert die übrigbleibenden Kantenteile auf die Pro- 
jektionsebene. number_of_edges() bestimmt die Anzahl der projizierten Kanten. 
insert(i,endpoints(i)) fügt die Endpunkte der projizierten Kante i zur Liste der 
Schnittpunkte von i. same polygon(i,j) stellt fest, ob die Kanten i und j zum glei- 
chen Polygon gehören. intersect(i,j) bestimmt den Schnittpunkt zwischen i und 
j. insert(i,s) fügt s zur Liste der Schnittpunkte von i. number_of_segments() 
bestimmt die Anzahl der durch Schnittpunktbildung erzeugten Kantensegmente. m = 
compute midpoint(i) berechnet den Mittelpunkt des projizierten Kantensegmentes i, 
back_project(m) berechnet den zugehörigen, auf dem ursprünglichen Kantensegment 
liegenden Punkt mittels Rückwärtsprojektion. number_of_polygons() bestimmt die An- 
zahl der Polygone der Szene. belongs_to(i,p) bestimmt, ob Kante i zum Polygon p 
gehört. Wenn dies nicht der Fall ıst, bestimmt intersect_projector(b,p) den Schnitt- 
punkt zwischen dem durch b und das Projektionszentrum verlaufenden Projektor und der 
Ebenen, die das Polygon p enthält. param(s,b) bestimmt den Parameter des Schnitt- 
punktes bzgl. des Projektors durch b. Das Polygon p verdeckt i, wenn alpha zwischen 
zmin/z(m) und 1 liegt, und der Schnittpunkt s innerhalb von p liegt. Letzteres wird 
mittels inside(s,p) festgestellt. z(m) ist die z-Komponente des Punktes m. Jedes 
sichtbare Kantensegment i wird durch display(i) auf dem Bildschirm dargestellt. 
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Abbildung 4.5: Bei sich durchdrin- 
genden Objekten kann sich die Sicht- 
barkeit einer Kante eines Objektes 
beim Eintritt in ein anderes Objekt 
ändern. Dies ist z.B. für das drei- 
eckförmige Objekt beim Eintritt in 
den Würfel der Fall. Außerdem tre- 
ten zusätzliche Schnittkanten auf, die 
sichtbar sein können. 


Für sich durchdringende Objekte stimmt die Annahme nicht, daß sich die 
Sichtbarkeit einer Kante k an einem Punkt 5 nur dann ändern kann, wenn 
ö auf einen Punkt 5’ projiziert wird, der Schnittpunkt der Projektion k’ von 
k mit der Projektion einer anderen Kante 5 ist. Die Sichtbarkeit von k kann 
sich auch an einem Schnittpunkt mit der Oberfläche eines anderen Objektes 
ändern, vgl. Abbildung 4.5. Man kann den beschriebenen Algorithmus auch 
in diesem Fall anwenden, wenn man zusätzliche Kanten berechnet, die durch 
den Schnitt von Oberflächen unterschiedlicher, sich durchdringender Objekte 
entstehen. Die Berechnung der Schnittkanten ist recht aufwendig, weil prinzi- 
piell für jede Oberfläche eines Objektes der Schnitt mit allen Oberflächen aller 
anderen Objekte berechnet werden muß. Die errechneten Schnittkanten werden 
als zusätzliche Kanten in die die Szene beschreibende Datenstruktur aufgenom- 
men, und werden bei Abarbeitung des Algorithmus als Kanten berücksichtigt, 
die nicht zu einem speziellen Objekt-Polygon gehören. Das bedeutet, daß sie 
bei der Berechnung der Schnittpunkte mit der Projektion jeder anderen Kante 
geschnitten werden. 


Die Laufzeit zur Berechnung der Schnittpunkte zwischen den Projektionen der 
Kanten kann durch die Verwendung von umgebenden Rechtecken reduziert 
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(Umaz, Umar) Abbildung 4.6: Umgebendes Recht- 
eck zur Projektion k’ einer Kante k. 
Weil k’ in der Projektionsebene liegt, 
verwenden wir zur Beschreibung das 
(u, v)-Koodinatensystem. 





(Umin; Umin) 





u 


werden. Für ein Geradensegment in der Projektionsebene definieren dessen 
beide Endpunkte 5} = (Umin; Umin) und #2 = (Umaz; Ymaz) den linken unteren 
bzw. rechten oberen Eckpunkt des zugehörigen umgebenden Rechtecks, vgl. Ab- 
bildung 4.6. Die Projektionen kj und ky zweier Kanten kı und kz mit den proji- 
zierten Endpunkten (Umin,.i, Umin,ı) und (Umaz,i, Umaz,ı) PZW. (Umin2, Umin,2) und 
(Umaz,2, Umaz,2) Können sich nicht schneiden, wenn 


Umaz,i < Umin,2 oder Umaz,2 < Umin oder 


Umaz,1 < Umin,2 oder Umaz,2 < Umin,l 


Nur wenn keine dieser Bedingungen erfüllt ist, kann ein Schnittpunkt zwischen 
k! und ky existieren und die Schnittpunktberechnung muß durchgeführt wer- 
den. Mit diesem einfachen Test, der nur Vergleiche enthält, kann für eine große 
Anzahl von Kanten ein Schnittpunkt von vorneherein ausgeschlossen werden. 
Eine weitere Reduzierung der Laufzeit für die Berechnung der Schnittpunkte 
erreicht man durch Sortieren der Kanten nach aufsteigenden u„in-Werten. Vor 
Berechnung der Schnittpunkte von k/ mit den anderen Kanten der Szene kann 
man durch binäre Suche über die unin-Werte eine Kante k) bestimmen, für die 
als erstes Umaz,ı < Umin,2 gilt. Alle nach ky in der umin-Liste stehenden Kanten 
kı können ki nicht schneiden, da Umaz,ı < Umin2 < Umin, Ist. Ein ähnliches 
Verfahren kann mit den Unas-Werten, den Ymin-Werten und den Umas-Werten 
durchgeführt werden. Dieses recht einfache Verfahren zur Schnittpunktberech- 
nung ist in vielen Fällen den weiter vorne erwähnten aufwendigeren Verfahren 
überlegen. Dies liegt vor allem an dem geringen Verwaltungsaufwand des hier 
beschriebenen Verfahrens und an der Tatsache, daß für komplexe Szenen die 
Projektion der meisten Kanten nur einen kleinen Bereich des Fensters auf der 
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Projektionsebene einnimmt. Mit dem beschriebenen einfachen Test kann daher 
in sehr vielen Fällen ein Schnittpunkt von vorneherein ausgeschlossen werden. 


Im zweiten Schritt des Algorithmus wird bestimmt, ob ein Kantensegment sicht- 
bar ist oder nicht. Dazu muß der Schnitt des Projektors @ = am mit allen 
Polygonen der Szene bestimmt werden. Man kann die Anzahl der zu testen- 
den Polygone in den meisten Fällen reduzieren, indem man jedem Polygon P 
ein durch zwei Punkte Ä = (£min, Ymin,Zmin) und B = (Imaxı Ymazı Zmaz) DE 
stimmtes umgebendes Volumen zuordnet, das P ganz enthält. Die Polygone 
werden in der Reihenfolge steigender zmin-Werte ihrer umgebenden Volumen 
auf Schnittpunkt mit dem Projektor getestet. Dazu werden die umgebenden 
Volumen nach ihren zyin-Werten sortiert. Ein Schnittpunkt mit einem Polygon 
P kann nur existieren, wenn der Projektor das zugehörige umgebende Volumen 
schneidet. Nur in diesem Fall braucht der Schnittpunkt mit der Ebene, die P 
enthält, berechnet zu werden. Der Test, ob der gefundene Schnittpunkt inner- 
halb von P liegt, kann durch Bestimmung eines umgebenden Rechtecks zu P 
erleichtert werden, das in der Ebene, die P enthält, definiert wird. Die Methode 
der umgebenden Volumen wird auch beim Ray-Tracing-Verfahren verwendet, 
um die Laufzeit für die Schnittpunktberechnung zwischen den Strahlen und den 
Objekten zu reduzieren, vgl. Abschnitt 8.6. 


Der gerade beschriebene Algorithmus macht keinerlei Annahmen über die Ar- 
beitsweise des verwendeten Displaysystems und ist deshalb sowohl für Vektor- 
als auch für Rastergraphiksysteme geeignet. Dies drückt sich auch in der Tat- 
sache aus, daß der Algorithmus sichtbare Kanten, keine sichtbaren Oberflächen 
berechnet.?” Prinzipiell ist der Algorithmus für Rastergraphiksysteme aber so 
erweiterbar, daß aus den errechneten sichtbaren Kanten die zugehörigen sicht- 
baren Oberflächen berechnet werden können. Wir werden dies hier nicht näher 
ausführen. Statt dessen stellen wir ın den folgenden Abschnitten spezielle Al- 
gorithmen für Rastergraphiksysteme vor. Da diese weniger allgemein als der 
gerade behandelte Algorithmus sind, sind sie im allgemeinen auch effizienter. 


4.3 z-Puffer- Algorithmus 


Ein sehr häufig zur Bestimmung der sichtbaren Oberflächen einer Szene ver- 
wendeter Algorithmus ist der z-Puffer-Algorithmus, vgl. [Cat74], [BG89], 
[FvDFH90]. Der Algorithmus setzt voraus, daß neben dem Pufferspeicher, in 
dem für jedes Bildschirmpixel der zugehörige Farbwert abgespeichert wird, ein 


®Mit Vektorgraphiksystemen können nur Drahtgittermodelle dargestellt werden. 
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ebenso großer z-Puffer zur Verfügung steht, in dem für jedes Pixel p ein Fließ- 
kommawert z(p) abgelegt werden kann. z(p) gibt an, welchen z-Wert der durch 
das Pixel p dargestellte Punkt des sichtbaren Polygons hat. Wenn die Pro- 
jektionsebene im Abstand d senkrecht auf der z-Achse steht, ist z(p) — d der 
Abstand des dargestellten Punktes von der Projektionsebene. Zur Darstellung 
der sichtbaren Oberflächen der Szene wird der z-Puffer mit dem z-Wert der 
hinteren Clip-Ebene zo. initialisiert, der Pufferspeicher wird mit der Hinter- 
grundfarbe initialisiert. Dann werden die Polygone der darzustellenden Objekte 
in einer beliebigen Reihenfolge auf die Projektionsebene abgebildet, indem ihre 
Eckpunkte projiziert werden. Für jedes Pixel, das von der Projektion eines Po- 
lygons P überdeckt wird, wird mittels einer Rückwärtsprojektion der z-Wert 
des zugehörigen projizierten Punktes von P bestimmt. Wenn dieser z-Wert 
kleiner ist als der für das Pixel im z-Puffer eingetragene Wert, liegt der ge- 
fundene Punkt von P vor dem bisher für das Pixel ermittelten Punkt. Der 
z-Puffer-Wert wird aktualisiert und der Pufferspeicher-Eintrag des Pixels wird 
auf den Farbwert von P gesetzt. 


Das Bestimmen der von der Projektion von P überdeckten Pixel kann mit 
Hilfe eines Scangeraden-Verfahrens erfolgen, vgl. Abschnitt 2.3.1. Abbildung 
4.7 zeigt eine Programmskizze des Verfahrens. Bis auf die Rückwärtsprojektion 
arbeitet der Algorithmus im Bildraum. Die Rückwärtsprojektion für ein Pixel 
P' = (x,y,d)? mit dem Ortsvektor 5" kann wie folgt durchgeführt werden: Wenn 
das Projektionszentrum im Ursprung liegt, ist ® = «p’ die Gleichung des durch 
5 verlaufenden Projektors. Wenn n(P) der Normalenvektor des Polygons P 
ist, ist n(P)-g = e die Gleichung der Ebene, die P enthält. J € IR® ist der 
Ortsvektor eines beliebigen auf der Ebene liegenden Punktes, e € IR ist eine 
Konstante. Den Schnittpunkt des Projektors mit der Ebene erhält man durch 
Einsetzen der Projektorgleichung in die Ebenengleichung: 


en) + an Ey 
n-q=zn: ap =e 


Daraus erhält man «: 


ww 
® 


RD ne +ny+tn.d 


Den auf 5’ projizierten Punkt P erhält man durch Einsetzen dieses Wertes in die 
Projektorgleichung 5 = af’. Die gesuchte 2-Komponente dieses Punktes ist: 


ed 


PT N, +nyy+n.d 
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void zbuffer(m,n); 
int m,n; 
{ 
int x,y,p; 
POINT b; 
eliminate_ self hidden(); 
for (x=0; x<m; x++) do 
for (y=0; y<n; y++) do {f 
refresh_buffer[x,y] = background; 
z_buffer[x,y] = zmax; 
} 
for (p=0; p<number_of_polygons(); p++) do { 
project(p); 
for (x=0; x<m; x++) do 
for (y=0; y<n; y++) do { 
if (covered(p,x,y)) { 
b = back project (build point (x,y, a); 
if (z.buffer[x,y] > z(b)) { 
z_buffer[x,y] = z(b); 
refresh buffer[x,y] = color(p,b); 


} 


} 





Abbildung 4.7: Programmskizze zum z-Puffer-Algorithmus. Nach Elimination der 
selbst-verborgenen Oberflächen wird der Pufferspeicher refresh_buffer mit der Hin- 
tergrundfarbe , der z-Puffer z_.buffer mit dem z-Wert der hinteren Clip-Ebene zmax 
initialisiert. m und n geben die Anzahl der Pixel in z- und y-Richtung an. project (p) 
projiziert das Polygon p auf die Projektionsebene, covered(p,x,y) bestimmt, ob das 
Pixel (x,y) vom Polygon p überdeckt wird. Wenn dies der Fall ist, wird durch 
back_project(build point(x,y,d)) der zugehörige Punkt b auf p bestimmt. Wenn 
die z-Komponente dieses Punktes kleiner ist als der für das Pixel im z-Puffer eingetragene 
Wert, wird der z-Puffer-Eintrag des Pixels auf diesen Wert gesetzt und der Pufferspeicher 
wird auf den Farbwert color(p,b) von p am Punkt b gesetzt. 
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Der z-Puffer-Algorithmus kann auch eingesetzt werden, wenn die Seitenflächen 
der darzustellenden Objekte keine ebenen Polygone, sondern beliebig geformte 
Oberflächen sind. In diesem Fall muß für die Rückwärtsprojektion nur ein ande- 
rer Schnittpunkttest verwendet werden, der Rest des Algorithmus ist identisch. 


Der von dem Algorithmus verwendete z-Puffer kann prinzipiell im Hauptpeicher 
des verwendeten Rechners allokiert werden. Dies hat jedoch den Nachteil, daß 
je nach Größe des zur Verfügung stehenden Hauptspeichers bereits ein großer 
Teil für den z-Puffer benötigt wird. Daher wird in modernen Workstations oft 
ein eigener z-Puffer-Speicher in Hardware zur Verfügung gestellt, der ähnlich 
dem Pufferspeicher angesprochen werden kann. Da der z-Puffer-Algorithmus 
für die meisten Anwendungen keine 32 Bit Genauigkeit braucht, werden für den 
z-Puffer für einfachere Workstations oft nur 16 oder 24 Bit für einen z-Puffer- 
Eintrag zur Verfügung gestellt.° 


Der z-Puffer-Algorithmus kann als eine Art bucket sort in x und y angese- 
hen werden, bei dem die Pixel des Bildschirms als buckets dienen. Dabei wird 
für jedes Pixel immer der kleinste bisher gefundene z-Wert abgespeichert. Bei 
ungünstiger Abarbeitungsreihenfolge der Polygone kann es vorkommen, daß die 
im z-Puffer abgespeicherten Werte - und damit auch die im Pufferspeicher ab- 
gespeicherten — oft überschrieben werden. Dies kann man zum größten Teil 
vermeiden, wenn man die Polygone vorab nach ihren minimalen z-Werten sor- 
tiert und sie nach aufsteigenden z-Werten abarbeitet. Wenn n die Anzahl der 
Polygone der darzustellenden Szene ist und m die Anzahl der Pixel, die von der 
Projektion eines Polygons im Durchschnitt überdeckt werden, ist die Laufzeit 
des z-Puffer-Algorithmus O(m - n). Tests zeigen, daß die Laufzeit weitgehend 
unabhängig von der Anzahl der darzustellenden Polygone ist. Laut [FvDFH90] 
liegt der Grund dafür darin, daß mit steigender Anzahl der Polygone deren 
Größe und damit auch die Anzahl der von ihnen überdeckten Pixel abnimmt. 
Die Zeit für das Besetzen von Pufferspeicher und z-Puffer bleibt daher bei stei- 
genden Anzahl von Polygonen annähernd konstant. Lediglich die Zeit für das 
Errechnen der Projektionen der Polygone steigt an. 


Für jedes Bildschirmpixel muß ein Fließkommawert gespeichert werden. Bei einer Bild- 
schirmauflösung von 1024 x 1024 sind dies z.B. 10° Fließkommawerte. Bei Verwendung 
von 32 Bit zur Darstellung eines Fließkommawertes belegt der z-Puffer damit 4MB des 
Hauptspeichers. 

5Eine sPARcostation2 in der GS-Ausführung stellt z.B. einen 16-Bit-z-Puffer zur 
Verfügung. In der GT-Ausführung wird ein 24-Bit-z-Puffer verwendet. 
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4.4 Scangeraden-Algorithmen 


Der z-Puffer- Algorithmus bearbeitet die Polygone der darzustellenden Szene 
in einer bestimmten Reihenfolge und führt für die Verarbeitung eines Poly- 
gons P die erforderlichen Operationen für alle von P betroffenen Pixel durch. 
Die Scangeraden-Algorithmen, die wir in diesem Abschnitt besprechen werden, 
vgl. auch [Bou70], [Wat70], [SSS74], [BG89], [FvDFH90], bearbeiten dagegen 
die Pixel des Bildschirms in einer bestimmten Reihenfolge und berücksichti- 
gen bei der Bearbeitung eines Pixels alle Polygone der Szene, die den Farbwert 
des Pıxels beeinflussen können. Die Pixel werden zeilenweise bearbeitet, indem 
eine horizontale Scangerade von unten nach oben über den Bildschirm gescho- 
ben wird. Die Punkte der Objekt-Oberflächen, die an einer Pixelposition (z,y) 
sichtbar sein können, liegen auf einem Projektor, der durch das im Ursprung 
liegende Projektionszentrum und das Pixel (z,y,d)? verläuft. Analog liegen die 
Punkte, die in einer Bildschirmzeile sichtbar sein können, auf einer Ebene, die 
durch die Bildschirmzeile und das Projektionszentrum verläuft. Da diese Ebene 
während der Bearbeitung der Zeilen des Bildschirms über die Objekte gescho- 
ben wird, wird sie auch als Scanebene bezeichnet. Wenn die Oberflächen der 
darzustellenden Objekte durch ebene Polygone definiert werden, erzeugt der 
Schnitt einer Scanebene mit den Oberflächen der Objekte Geradensegmente 
im Weltkoordinatensystem. Die Projektion dieser Geradensegmente auf den 
Bildschirm erzeugt Geradensegmente, die auf der zugehörigen Bildschirmzeile 
liegen, vgl. Abbildung 4.8. Wenn mehrere projizierte Geradensegmente über- 
lappen, kann man mit Rückwärtsprojektion bestimmen, welche dieser Segmente 
sichtbar sind. Abbildung 4.9 zeigt eine einfache Realisierung des Verfahrens. 
Die Rückwärtsprojektion wird mit Hilfe eines z-Puffers durchgeführt, der eine 
Bildschirmzeile umfaßt. Für jedes Pixel der betrachteten Bildschirmzeile wird 
eine separate Rückwärtsprojektion durchgeführt, mit der der für dieses Pixel 
sichtbare Punkt der Oberflächen bestimmt wird. 


Diein Abbildung 4.9 wiedergegebene Realisierung kann in zweierlei Hinsicht we- 
sentlich verbessert werden. Erstens brauchen für eine Bildschirmzeile nicht alle 
Polygone der Szene auf Schnitt mit der aktuellen Scanebene getestet zu werden. 
Ein Polygon, das von der über die Szene geschobenen Scanebene schon verlas- 
sen wurde, kann nicht mehr von dieser geschnitten werden. Man kann diese 
unnötigen Tests verhindern, indem man eine Liste aktiver Polygone hält, in 
der alle von der aktuellen Scanebene geschnittenen Polygone abgelegt werden. 
Diese Liste wird beim Übergang zur nächsten Scanebene aktualisiert, indem 
evtl. neue Polygone hinzugefügt und gerade von der Scanebene verlassene Poly- 
gone gelöscht werden. Zu jedem Polygon P wird die maximale y-Ausdehnung 
Ymaz(P)) seiner Projektion und die minimale y„-Ausdehnung ymin(P) seiner Pro- 
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Projektionsebene 


Objekt 1 





u. * Objekt 2 





Abbildung 4.8: Veranschaulichung des Scangeraden-Algorithmus. 


172 KAPITEL 4. BESTIMMUNG SICHTBARER OBERFLÄCHEN 





void scan_line_hidden surface(m,n); 
int m,n; 

{ 

int x,y,Pp; 

SEGMENT g,gp; 

POINT b; 













eliminate_self_hidden(); 
for (x=0; x<n; x++) do 
for (y=0; y<m; y++) do 
refresh_buffer[x,y] = background; 
for (y=0; y<m; y++) do { 
for (x=0; x<n; x++) do 
z_buffer[x] = zmin; 
for (p=0; p<number_of_polygons(); p++) do { 
g = intersect scan plane(y,p); 
gp = project segment (g); 
for (x=0; x<n; x++) do 
if (covered(gp,x,y)) { 

b = back project(build point (x,y,d)); 
if (z_buffer[x] > z(b)) { 
z_buffer[x] = z(b); 

refresh_buffer[x,y] = color(p,b); 















} 






} 





Abbildung 4.9: Einfache Realisierung des Scangeraden-Algorithmus. z_buffer ist ein 
z-Puffer, der eine Bildschirmzeile umfaßt. intersect_scan_plane(y,p) berechnet das 
Schnitt-Geradensegment zwischen der zur Bildschirmzeile y gehörenden Scanebene und 
dem Polygon p. project _segment(g) berechnet die Projektion des Geradensegmen- 
tes g. Für jedes von der errechneten Projektion überdeckte Pixel wird eine separate 
Rückwärtsprojektion durchgeführt. Die Realisierung erfolgt analog der Programmskizze 
in Abbildung 4.7. 
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jektion bestimmt. Um das Aktualisieren der Liste der aktiven Polygone zu 
vereinfachen, legt man eine Liste der passiven Polygone an, die zu Beginn alle 
Polygone der Szene enthält, geordnet nach minimaler y„-Ausdehnung ihrer Pro- 
jektion. Die Liste der aktiven Polygone ist genauso geordnet. Beim Übergang 
von der Scangerade y = Yscan — 1 zur Scangerade y = Yscan werden aus der Liste 
der aktiven Polygone alle Polygone P gelöscht, deren maximale y-Ausdehnung 
Ymaz(P) größer ist als Yscan. Außerdem werden alle Polygone Q in der passi- 
ven Liste, deren minimale y-Ausdehnung Yymin(Q) gleich Yscan ist, in die aktive 
Liste übernommen und aus der passiven Liste gelöscht. Bei der Bearbeitung 
einer Scangerade werden nur die in der aktiven Liste abgespeicherten Polygone 
berücksichtigt. Dieses Verfahren ist ebenso wie das Grundverfahren aus Abbil- 
dung 4.9 für die Anwendung auf Objekte mit gekrümmten Oberflächen geeignet. 
Es muß nur ein geeigneter Schnittpunkttest verwendet werden. 


Wenn die Oberflächen der darzustellenden Objekte durch ebene Polygone defi- 
niert werden, kann zweitens durch eine Verallgemeinerung des Verfahrens aus 
Abschnitt 2.3.1 eine weitere Reduktion der Laufzeit erreicht werden. Das Ver- 
fahren nutzt die Kantenkohärenz aus, indem es eine Liste der aktiven Kanten 
verwendet, die alle von der aktuellen Scanebene geschnittenen Kanten enthält. 
Die aktiven Kanten sind nach den x-Werten der Schnittpunkte der Scange- 
raden mit der Projektion der Kanten sortiert. Beim Übergang zur nächsten 
Scangerade wird die Liste der aktiven Kanten mit Hilfe einer Liste der passiven 
Kanten aktualisiert, die die Kanten aller Polygone enthält, sortiert nach der 
minimalen y-Ausdehnung ihrer Projektion. Diese Liste kann mit bucket sort 
aufgebaut werden, wobei für jede Scangerade, d.h. für jede Bildschirmzeile, ein 
bucket verwendet wird. Innerhalb eines buckets sind die Kanten nach steigen- 
den z-Werten des unteren Endpunktes ihrer Projektion sortiert. Kanten, deren 
untere Endpunkte übereinstimmen, werden nach fallender Steigung geordnet, 
d.h. im Uhrzeigersinn. Wir beschreiben die Arbeitsweise des Verfahrens anhand 
der Beispielszene in Abbildung 4.10. Die Liste der passiven Kanten für diese 
Szene enthält drei nichtleere buckets: 

bucket y=2 enthält AB, AC 

bucket y=5 enthält DE, DF, FE 

bucket y=7 enthält CB 


Innerhalb der einzelnen buckets sind die Kanten in der angegebenen Reihen- 
folge abgelegt. Für die Scangerade y = 3 enthält die Liste der aktiven Kanten 
die Kanten AB und AC in dieser Reihenfolge. Die r-Werte der Schnittpunkte 
mit der Scangerade seien z£ı < x3. Die x-Werte der Schnittpunkte mit der 
Scangeraden sind zı = 3 und zz = d. Beim Lauf von links nach rechts über 
die Scangerade stellt man bis zum Schnittpunkt x, die Hintergrundfarbe dar. 
Am Punkt x; trifft man auf die aktive Kante AB. Der darzustellende Farb- 
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x=3 x=7 x=12 x=17 


Abbildung 4.10: Beispielszene mit zwei sich überlappenden Dreiecken ABC und DEF. 
Dargestellt ist die auf der Projektionsebene erzeugte Abbildung. 


wert ändert sich zu dem Farbwert des Polygons Pı, zu dem AB gehört. Das 
Statusbit von Pı wird auf drinnen gesetzt. Am Punkt z; trifft man auf die ak- 
tive Kante AC. Da das Statusbit von P, gesetzt ist und da AC ebenfalls zu Pı 
gehört, wird am Punkt zz das Polygon P, wieder verlassen, das Statusbit von 
P, wird daraufhin auf draußen gesetzt. Die dargestellte Farbe wechselt wieder 
zur Hintergrundfarbe. Für die Scangerade y = 8 enthält die Liste der aktiven 
Kanten die Kanten AB, DE, CB und FE in dieser Reihenfolge. Die z-Werte 
der Schnittpunkte mit der Scangeraden seien &ı < 172 < £3 < z4. Beim Lauf 
von links nach rechts über die Scangerade stellt man bis zum Schnittpunkt zı 
wieder die Hintergrundfarbe dar. Am Punkt zı trifft man auf die aktive Kante 
AB, der darzustellende Farbwert ändert sich zum Farbwert des Polygons Pı, 
das Statusbit von Pı wird auf drinnen gesetzt. Am Punkt x; trifft man auf die 
aktive Kante DE. Diese Kante gehört zu P,, das Statusbit von P, wird daher 
ebenfalls auf drinnen gesetzt. Man ist somit innerhalb von zwei Polygonen und 
muß bestimmen, welches der beiden Polygone sichtbar ist. Dazu verwendet 
man wieder die Methode der Rückwärtsprojektion. In unserem Beispiel liegt 
P, vor Pı, der darzustellende Farbwert ändert sich also zum Farbwert von P;. 
Am Punkt z3 trifft man auf die aktive Kante BC, die zu Pı gehört. Das Sta- 
tusbit von Pı wird auf draußen gesetzt, der dargestellte Farbwert ändert sich 
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Abbildung 4.11: Zur Bestimmung des 
nach Verlassen eines Polygons sichtbaren 
Polygons reicht es nicht aus, sich das vor 
Betreten aktive Polygon zu merken. Vor 
Betreten von P; ist Pı aktiv, nach Verlassen 
von P; ıst P3 aktıv. 





nicht. Am Punkt x; trifft man auf die Kante EF, die zu P, gehört. Das Sta- 
tusbit von P} wird auf draußen gesetzt, der dargestellte Farbwert wird wieder 
die Hintergrundfarbe. 


Wenn beim Lauf über die aktuelle Scangerade das sichtbare Polygon verlassen 
wird, muß im allgemeinen Fall das danach sichtbare Polygon mit Rückwärtspro- 
jektion bestimmt werden, vgl. Abbildung 4.11. Beim Übergang von der Scange- 
rade y = y; zur Scangerade y = yirı = yi + 1 muß die Liste der aktiven Kanten 
aktualisiert werden: 


(1) Alle Kanten, deren oberer Endpunkt einen y-Wert kleiner als y;+ı hat, 
werden aus der Liste entfernt. 

(2) Die Schnittpunkte zwischen den in der Liste verbleibenden Kanten und der 
Scangeraden werden aktualisiert. Dazu müssen die 2-Werte neu bestimmt 
werden. Wenn y = mr + b die Gleichung einer Kante ist, gilt: 


y = mu+b 
Yz+ı 7 muatb=yt+tl=mu+b+l 


Also ist 241 = z; + 1/m, zur Aktualisierung reicht die Addition von 1 /m 
aus. 

(3) Die Kanten der passiven Kantenliste in bucket y;+1 werden in die Liste ein- 
sortiert. Da die Kanten innerhalb der buckets nach steigenden z-Werten 
sortiert sind, kann das Einsortieren in die Liste der aktiven Kanten durch 
Mischen in linearer Zeit erfolgen. 


Nach dem Aktualisieren der Schnittpunkte in (2) stimmt deren Reihenfolge 
evtl. nicht mehr. Dies sieht man z.B. an Abbildung 4.10 beim Übergang von 
der Scangerade y = 8 zur Scangerade y = 9: Für die Scangerade y = 8 enthält 
die Liste die aktiven Kanten AB, DE, CB, FE in dieser Reihenfolge. Für die 
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Scangerade y = 9 müssen die Kanten DE und CB vertauscht werden, weil CB 
zuerst geschnitten wird. Es ist also eine Neusortierung der Liste erforderlich. 
Dazu verwendet man am besten Sortieren durch Vertauschen benachbarter Ele- 
mente (bubble sort): Man vertauscht benachbarte Elemente so lange, bis sie in 
der richtigen Reihenfolge sind. Obwohl dieses Verfahren im allgemeinen Fall 
eine Laufzeit von O(n?) hat, ist es in dem hier vorliegenden Fall das beste Ver- 
fahren. Dies ist deshalb der Fall, weil beim Übergang von einer Scangeraden 
zur nächsten wegen der Kantenkohärenz keine sehr große Unordnung entsteht. 
Es sind also nicht viele benachbarte Elemente zu vertauschen. 


Abbildung 4.12 zeigt eine Programmskizze des beschriebenen Verfahrens. Zur 
einfacheren Formulierung wird ein zusätzliches Polygon Pintergrung verwendet, 
das von allen anderen Polygonen überdeckt wird und das die Farbe des Hinter- 
grunds hat. Ppintergrund Sei so groß, daß die Projektion auf die Projektionsebene 
den gesamten Bildschirm abdeckt. 


4.5 Sortierung nach dem Abstand vom Be- 
trachter 


Die Idee des Tiefensortier-Algorithmus (depth-sort-Algorithmus), vgl. [NNS72], 
[SSS74], [FvDFH90], besteht darin, die Oberflächen der Objekte nach ihrem 
Abstand vom Betrachter auf dem Bildschirm darzustellen. Dazu werden die 
Oberflächen zuerst nach fallendem Abstand vom im Ursprung liegenden Pro- 
jektionszentrum sortiert und in dieser Reihenfolge dargestellt. Daß ein näher 
zum Betrachter liegendes Polygon P ein weiter weg liegendes Polygon Q über- 
deckt, wird dadurch realisiert, daß Q vor P dargestellt wird und daß bei der 
Darstellung von P der von P überdeckte Teil von Q im Pufferspeicher über- 
schrieben wird. 


In dieser einfachen Form ist der Algorithmus allerdings nur in der Lage, sol- 
che Szenen korrekt darzustellen, für die eine eindeutige Sortierung nach dem 
Abstand vom Betrachter möglich ist. Dies ist oft nicht der Fall, z.B. weil Ob- 
jekte so dicht beieinander liegen, daß für die sie definierenden Polygone eine 
solche Sortierung nicht existiert, vgl. Abbildung 4.13. In diesem Fall müssen 
Polygone für die Bildschirmdarstellung evtl. aufgespalten werden. Wir neh- 
men im folgenden an, daß jedem Polygon P ein umgebender Quader zugeord- 
net ist, der durch seine beiden Extrempunkte (zyin(P), Yymin(P), Zmin(P)) und 
(£maz(P), Ymaz(P),Zmar(P)) bestimmt ist. Sei P das am weitesten vom Be- 
trachter entfernte Polygon, d.h. das Polygon mit dem größten Wert zyua.(P). 
Bevor P auf dem Bildschirm dargestellt wird, muß für alle Polygone Q, deren 


4.5. SORTIERUNG NACH DEM ABSTAND VOM BETRACHTER 177 







void scan line_edgelist(m,n); 
int m,n; 















ACTIVE_LLIST al; 
PASSIVE_LIST pl; 
int p-akt,p,9,K,xX,y; 





eliminate self _hidden(); 
clip-and project(); 
create_lists(al,pl); 
for (y=0; y<n; y++) do { 
delete_edges(al,y); 
resort(al); 
add_bucket(al,pl,y); 
p_akt = p_background; 
for (x=0; x<m; x++) do { 
if (ksintersection(al,x)) { 
p = polygon(k); 
switch_status(p); 
p_akt = compare(p_akt); 





setpixel(x,y,color(p_.akt)); 


Abbildung 4.12: Programmskizze zum Scangeraden-Algorithmus bei Verwendung einer 
Liste der aktiven Kanten. ACTIVE_LIST und PASSIVE_LIST seien geeignete Datenstruk- 
turen zur Ablage der Liste der aktiven bzw. passiven Kanten. create_lists(al,pl) er- 
zeugt die Liste der passiven Kanten pl und initialisiert die Liste der aktiven Kanten al. Die 
äußere for-Schleife durchläuft die Zeilen des Bildschirms. Beim Übergang zur nächsten 
Zeile werden mit delete_edges(al,y) alle Kanten aus al entfernt, die von der neuen 
Scangeraden nicht mehr geschnitten werden. resort (al) sortiert die verbleibenden Kan- 
ten neu, add_bucket(al,pl,y) fügt die Kanten aus bucket y aus pl in al ein. Die 
innere for-Schleife läuft über die aktuelle Zeile des Bildschirms. intersection(al,x) 
bestimmt die Kante k aus al, die an Position x der aktuellen Bildschirmzeile y geschnitten 
wird, polygon(k) bestimmt das zugehörige Polygon p. switch_status(p) aktualisiert 
das Statusbit von p wie im Text beschrieben. compare(p_-akt) bestimmt, falls nötig mit 
Rückwärtsprojektion, welches Polygon ab Position x sichtbar ist. 
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Abbildung 4.13: Polygone mit überlappenden z-Bereichen. 


z-Ausdehnung mit der z-Ausdehnung von P überlappt, sichergestellt werden, 
daß Q nicht durch P verdeckt werden kann. Nur wenn dies der Fall ist, kann P 
vor Q dargestellt werden. Um dies zu überprüfen, werden die folgenden Tests 
durchgeführt, die nach steigender Komplexität geordnet sind. Sobald einer die- 
ser Tests erfüllt ist, steht fest, daß Q nicht durch P verdeckt werden kann. Wenn 
dies für alle Polygone Q gilt, die mit P in z überlappen, wird P dargestellt und 
die Tests werden für das Polygon mit dem nächstgrößten zu..-Wert wiederholt. 
Die folgenden Tests werden durchgeführt: 


1. Überlappen die --Ausdehnungen von P und Q nicht? 
2. Überlappen die y-Ausdehnungen von P und Q nicht? 


3. Liegt P ganz auf der Seite der Ebene, die Q enthält, auf der das Projek- 
tionszentrum nicht liegt, vgl. Abbildung 4.14? 


4. Liegt Q ganz auf der Seite der Ebene, die P enthält, auf der das Projek- 
tionszentrum liegt, vgl. Abbildung 4.14? 


5. Überlappen die Projektionen von P und Q nicht? 


Wenn keiner der fünf Tests erfüllt ıst, kann P nicht vor Q ın den Pufferspei- 
cher geschrieben werden. In diesem Fall werden die Tests wiederholt, wobei die 
Rollen von P und Q) vertauscht werden. P wird markiert, um zu verhindern, 
daß die Tests für P erneut ausgeführt werden. Man beachte, daß nach dem 
Vertauschen mit Q nur die Tests 3 und 4 wiederholt werden müssen. Wenn 
einer der Tests erfüllt ist, wird das Verfahren mit Q weitergeführt. Wenn auch 
in diesem Fall keiner der Test erfüllt ist, können P und Q nicht mit dem be- 
schriebenen Verfahren korrekt dargestellt werden. Statt dessen muß entweder 
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Abbildung 4.14: Blick von oben auf die dargestellte Szene. In der linken Abbildung ist 
Test 3 erfüllt, in der rechten ist Test 4 erfüllt. Das Projektionszentrum liegt im Ursprung. 


P an der Ebene von Q oder Q an der Ebene von P aufgespalten werden. Mit 
den dadurch entstehenden beiden neuen Polygonen werden die beschriebenen 
Tests dann wiederholt. 


Der Tiefensortier-Algorithmus ist ein Beispiel einer Gruppe von Algorith- 
men, die in der Fachliteratur als list-priority-Algorithmen bezeichnet wer- 
den. Alle Algorithmen dieser Gruppe stellen eine bestimmte Ordnung auf 
den Polygonen her, die sicherstellt, daß die erzeugte Darstellung korrekt ist, 
wenn die Polygone in dieser Ordnung dargestellt werden. Beim Tiefensortier- 
Algorithmus ist diese Ordnung durch den z-Abstand der Polygone vom Pro- 
jektionszentrum bestimmt. Ein anderer Algorithmus dieser Gruppe ist der 
BSP-Baum-Algorithmus (binary space partitioning), vgl. [SBGS69], [SSS74], 
[FAG83], [FvDFH90], der das von der Szene eingenommene Volumen rekursiv 
unterteilt, indem er Objektgruppen der Szene identifiziert. Wenn eine Ebene 
gefunden werden kann, die eine Menge von Objektgruppen von einer anderen 
trennt, können Objekte, die auf der gleichen Seite der Trennebene liegen wie 
das Projektionszentrum, nicht von Objekten auf der anderen Seite verdeckt, 
werden, können diese aber verdecken. Die so entstehenden Mengen von Ob- 
jektgruppen werden auf die gleiche Weise rekursiv weiter unterteilt. Als Iren- 
nebenen können z.B. Ebenen verwendet werden, in denen Polygone der Szene 
liegen. Wenn ein Polygon von einer Trennebene geschnitten wird, wird es in zwei 
Teile aufgespalten. Am besten werden Trennebenen verwendet, die möglichst 
wenig Aufspaltungen von Polygonen nach sich ziehen. Eine Heuristik zur Aus- 
wahl der Trennebenen findet man z.B. in [FAG83]. Der Unterteilungsprozeß 
stoppt, wenn jeder entstehende Bereich nur noch ein Polygon enthält. Der Un- 
terteilungsprozeß kann durch einen binären Baum, den BS’P-Baum, dargestellt 
werden, dessen innere Knoten die gewählten Trennebenen bzw. die zugehörigen 
Polygone repräsentieren und dessen Blätter den nicht weiter unterteilten Berei- 
chen bzw. dem darin enthaltenen Polygon entsprechen. Damit ist jedem Knoten 
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des BSP-Baums genau ein Polygon zugeordnet. Nachdem der BSP-Baum auf- 
gebaut ist, kann die Szene für eine beliebige Betrachterposition b dargestellt 
werden. Dazu wird der BSP-Baum top-down durchlaufen. Sei P das Poly- 
gon, das die Trennebene der Wurzel des BSP-Baums definiert. Die Szene wird 
korrekt dargestellt, wenn zuerst alle Polygone dargestellt werden, die auf der 
Seite der Trennebene liegen, auf der 5 nicht liegt. Dann wird P dargestellt und 
danach alle Polygone auf der anderen Seite der Trennebene. Die Kindknoten 
von P werden rekursiv mit dem gleichen Algorithmus bearbeitet. Ein ähnliches 
Verfahren wird beim Ray-Tracing-Verfahren eingesetzt, vgl. Abschnitt 8.6.1. 


Sowohl der Tiefensortier-Algorithmus als auch der BSP-Baum-Algorithmus 
führen eine Sortierung im Objektraum aus. Die einzige im Bildraum durch- 
geführte Operation ist das Setzen der Pixeleinträge im Pufferspeicher, wobei die 
Tatsache ausgenutzt wird, daß diese überschrieben werden können. Das Auf- 
spalten der Polygone wird beim Tiefensortier-Algorithmus während der Dar- 
stellung vorgenommen, beim BSP-Baum-Algorithmus dagegen während der 
Vorberechnungsphase, in der der BSP-Baum aufgebaut wird. In der beschrie- 
benen Form werden bei beiden Verfahren die Polygone in fallendem Abstand 
von Betrachter dargestellt, wobei näher zum Betrachter liegende Polygone wei- 
ter weg liegende evtl. überdecken können. Das bedeutet, daß ebenso wie beim 
z-Puffer-Algorithmus Pixel mehrfach gesetzt werden können. Eine Variante 
des Algorithmus besteht darin, die Polygone mit steigendem Abstand vom Be- 
trachter darzustellen, wobei aber nur solche Pixel gesetzt werden, die noch 
nicht gesetzt wurden. Dies verhindert das Mehrfachsetzen von Pixeln, macht 
aber eine Überprüfung vor jedem Setzen erforderlich. 


4.6 Flächenunterteilungs-Algorithmus 


Der Flächenunterteilungs-Algorithmus, siehe auch [War69], [SSS74], [BG89], 
[FvDFH90], beruht auf einer flächenorientierten divide-and-conquer-Strategie, 
die in der Projektionsebene angewendet wird. Wenn bei der Bearbeitung eines 
Bildschirmbereiches festgestellt wird, daß im gesamten Bereich nur eine Objek- 
toberfläche sichtbar ist, wird für den Bereich der Farbwert dieser Oberfläche 
dargestellt. Ansonsten wird der Bereich in kleinere Bereiche unterteilt und 
das Verfahren wird rekursiv angewendet. Das Verfahren stoppt spätestens 
dann, wenn die Bereiche Pixelgröße erreicht haben. Der Ansatz nutzt also 
die Flächenkohärenz aus, d.h. die Tatsache, daß für benachbarte Pixel oft die- 
selbe Oberfläche dargestellt wird. Der Vorteil des Verfahrens liegt darin, daß 
für alle Pixel eines nicht weiter unterteilten Bereiches die sichtbare Oberfläche 
nur einmal bestimmt zu werden braucht. Sobald diese bekannt ist, kann der 
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Abbildung 4.15: Für einen nicht 
weiter unterteilten Bereich 3 kann es 
mehrere Kandidaten für das in dem 
Bereich dargestellte Objekt geben. 





Farbwert der Pixel des Bereiches sehr einfach bestimmt werden. Abbildung 4.16 
zeigt eine einfache Realisierung des Verfahrens. Die Rekursion kann abgebro- 
chen werden, wenn durch einen Bereich höchstens eine Kante verläuft. Man 
beachte, daß dies nicht gleichbedeutend damit ist, daß es nur einen Kandidaten 
für die sichtbare Oberfläche gibt, vgl. Abbildung 4.15. Die sichtbare Oberfläche 
muß mit Rückwärtsprojektion bestimmt werden. 


Um festzustellen, ob durch einen Bereich nur eine Kante verläuft, müssen prin- 
zipiell die Kanten aller Polygone untersucht werden. Man kann den Aufwand 
der Überprüfung verringern, indem man die Projektion eines Polygons P mit 
einem Rechteck umgibt, das die minimale und maximale Ausdehnung der Pro- 
jektion angibt. Das umgebende Rechteck zu P ist spezifiziert durch den lin- 
ken unteren Endpunkt (zmin(P),yYmin(P)) und den rechten oberen Endpunkt 
(£maz(P),Ymaz(P)). Ebenso nehmen wir an, daß der betrachtete Bereich B 
durch den linken unteren Endpunkt (£zmin(B),yYmin(B)) und den rechten obe- 
ren Endpunkt (max (B), Ymaz(B)) spezifiziert ist. In einigen Fällen kann durch 
Untersuchung des umgebenden Rechtecks eines Polygons P von vorneherein aus- 
geschlossen werden, daß eine Kante von P innerhalb des untersuchten Bereichs 
B verläuft. In diesen Fällen brauchen die Kanten von P nicht einzeln unter- 
sucht zu werden. Wenn das umgebende Rechteck zu P nicht mit B überlappt, 
d.h. wenn gilt 


(£min(P) > £maz(B)) oder (£maz(P) < £min(B)) oder 
(Ymin(P) > Ymaz(B)) oder (Ymaz(P) < Lmin(B)) 
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void subdivision hidden surface(m,n); 

int m,n; 

{ 
eliminate self _hidden(); clip and project(); 
area sub_div(0,0,m,n); 


} 


void area sub div(xstart,ystart,xend,yend) 
int xstart,ystart,xend,yend; 
{ 
int p, xmid,ymid; 
if(((xstart != xend) || (ystart != yend)) && 
((p=test for subdivision(xstart,ystart,xend,yend))'!=-1)){ 
xmid = (xstart + xend)/2; 
ymid = (ystart + yend)/2; 
area sub_div(xstart,ystart,xmid,ymid); /* links unten */ 
area sub_div(xmid,ystart,xend,ymid); /%x rechts unten */ 
areasub_div(xstart,ymid,xmid,yend); /* links oben */ 
area sub_div(xmid,ymid,xend,yend); /* rechts oben */ 
} 
else 
if (p == -1) 
p = back project (build point (xmid,ymid)); 
display area(xstart,ystart,xend,yend.color(p)); 


} 





Abbildung 4.16: Programmskizze zum Flächenunterteilungs-Algorithmus. Die rekur- 
sive Prozedur area sub_div wird von der übergeordneten Prozedur mit den Ausdeh- 
nungen des gesamten Bildschirms aufgerufen. (xstart,xend) und (ystart,yend) 
geben den linken unteren bzw. den rechten oberen Endpunkt des von area_sub_div 
bearbeiteten Bereichs an. Die rekursive Unterteilung wird -entweder abgebrochen, 
wenn der entstehende Bereich Pixelgröße erreicht hat oder wenn die Funktion 
test for subdivision(xstart,ystart,xend,yend) ein einzelnes sichtbares Polygon 
zurückliefert. Eine genauere Spezifizierung von test_for subdivision findet man in 
Abbildung 4.18. Wenn test for_subdivision ein Polygon zurückliefert, wird dessen 
Farbwert dargestellt, ansonsten wird das sichtbare Polygon mit Rückwärtsprojektion be- 
stimmt. 
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Tmaz(P),Ymaz(P) 


Abbildung 4.17: Das umgebende 
Rechteck zu P umgibt den betrachte- 
ten Bereich B vollständig. P schnei- 
det aber B. 
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Lmin(P),Ymin(P) 


so kann keine Kante von P innerhalb von B verlaufen. Wenn dies für alle Poly- 
gone der Szene gilt, wird für B die Hintergrundfarbe dargestellt. Wenn es nur 
ein einziges Polygon P gibt, dessen umgebendes Rechteck mit B überlappt, kann 
man B darstellen, indem man zuerst die Hintergrundfarbe darstellt und danach 
die von P überdeckten Pixel von B mit dem Farbwert von P überschreibt. 


Wenn es ein Polygon P gibt, das B vollständig umgibt, und das vor allen 
anderen Polygonen liegt, die mit B überlappen, dann wird B mit dem Farbwert 
von P dargestellt. Wenn ein Polygon P den Bereich B vollständig umgeben 
soll, muß auf jeden Fall das umgebende Rechteck zu P den Bereich vollständig 
umgeben, d.h. es muß gelten 


Lmin(P) < min(B) und Smas(P) > Lmas(B) und 
Ymin(P) < Ymin(B) und Ymaz(P) > Ymaz(B) 


Dieser Test ist eine notwendige, aber keine hinreichende Bedingung dafür, daß P 
den Bereich B umgibt, vgl. Abbildung 4.17. Wenn der Test erfüllt ist, muß gete- 
stet werden, ob eine der Kanten von P die Begrenzungskanten von B schneidet®. 


Wenn dies nicht der Fall ist, umgibt P den Bereich B vollständig. Wenn P den 


6Dazu kann man z.B. den Algorithmus von Cohen und Sutherland aus Abschnitt 2.4.1 
verwenden. 
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Bereich B vollständig umgibt, muß noch getestet werden, ob P vor allen an- 
deren Polygonen Pı,':-,Pr liegt, die mit B überlappen. Da P den Bereich 
vollständig umgibt, überlappt jedes P; mit P. Ob P vor einem der P; liegt, 
stellt man durch Verwendung eines Projektors fest, der durch einen beliebigen 
Punkt im überlappenden Bereich von P und P; verläuft. Wenn dieser Pro- 
jektor P vor P; trifft, wird P nicht von P; verdeckt. Wenn P von keinem 
der P; verdeckt wird, braucht der Bereich B nicht weiter aufgeteilt zu werden 
und erhält den Farbwert von P. In allen anderen Fällen muß B weiter auf- 
geteilt werden. Abbildung 4.18 zeigt eine mögliche Realisierung der Prozedur 
test for subdivision aus Abbildung 4.16. 


Das in Abbildung 4.16 skizzierte Programm stoppt die rekursive Unterteilung 
spätestens dann, wenn die entstandenen Bereiche Pixelgröße erreicht haben. 
Bei einer Bildschirmauflösung von 1024x1024 werden also höchstens 10 Unter- 
teilungsstufen erzeugt. Für Bereiche mit Pixelgröße kann das sichtbare Polygon 
mit Rückwärtsprojektion unter Verwendung eines durch den Pixelmittelpunkt 
verlaufenen Projektors bestimmt werden. Um Aliasing-Effekte zu vermeiden, 
kann man auch einen Projektor verwenden, der durch einen um einen zufälli- 
gen Betrag vom Pixelmittelpunkt abweichenden Punkt verläuft. Eine ähnliche 
Technik wird in Abschnitt 8.3 als probabilistisches Ray-Tracing-Verfahren be- 
handelt. Es besteht auch die Möglichkeit, eine dem Supersampling ähnliche 
Methode zu verwenden, vgl. Abschnitt 2.7.2.1. Dazu unterteilt man die Pi- 
xelbereiche weiter und bestimmt für jeden Subpixelbereich das sichtbare Poly- 
gon. Der Farbwert des darzustellenden Pixels ergibt sich dann durch Mittelung 
über die für die Subpixelbereiche ermittelten Farbwerte. 


Das bisher beschriebene Verfahren unterteilt die entstehenden Bereiche bei Be- 
darf in vier gleichgroße Unterbereiche. Dies hat den Nachteil, daß Bereiche, 
durch die Polygonkanten verlaufen, sehr fein unterteilt werden, vgl. Abbildung 
4.19. Da für jeden entstandenen Bereich eine Rückwärtsprojektion durchgeführt 
werden muß, steigt damit auch die Laufzeit an. Man kann das Entstehen von 
einigen der erzeugten Bereiche verhindern, wenn man zuläßt, daß durch einen 
nicht weiter aufgeteilten Bereich eine Kante verlaufen kann, ohne daß eines der 
beiden sichtbaren Polygone das Hintergrund-Polygon ist, vgl. [BG89]. Wenn 
die Kante sichtbar ist, wird sie innerhalb des Bereiches dargestellt. Die ent- 
stehenden beiden Teilbereiche werden mit den Farbwerten der angrenzenden 
Polygone aufgefüllt. Anstatt einer gleichmäßigen Aufteilung in vier Bereiche 
kann man auch eine ungleichmäßige Aufteilung unter Zuhilfenahme der Poly- 
gonknoten verwenden, vgl. Abbildung 4.20. Dies resultiert üblicherweise in 
weniger Bereichsaufteilungen. Eine andere Variante des Algorithmus besteht 
darin, die Bereiche entlang der Polygonkanten aufzuteilen, anstatt sie einfach 


in vier gleichgroße Teile zu spalten, vgl. [WA77] und [FvDFH90]. Dazu sor- 
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int test for subdivision(xstart,ystart,xend,yend) 
int xstart,ystart,xend,yend; 

{ 

AREA b; 

POINT a,s,ai,s2; 

int max z,p,p_akt,status; 














p-akt = p_background; 
status = simple; max z = zmax; 
b = area(xstart,ystart,xend,yend); 
for (p=0; p<number_of_ polygons(); p++) do 
if (overlap(p,b)) 
if (surround(p,b)) { 
s = back project (midpoint(b)); 
if (z(s) < maxz) { 
max z = z(s); p_akt = p; 
status = simple; 












} 
} 


else { 
a = any_overlap point(p,p_akt); 
si = intersect projector(a,p); 
s2 = intersect_projector(a,p_akt); 
if (z(si1) < z(s2)) { 
max z = z(si); 
if (p-akt != p_background) status = complex; 
















} 
} 


if (status == simple) return p_akt; else return -1; 








} 
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Abbildung 4.18: Implementierung von test_for_subdivision. Die dargestellte Funk- 
tion liefert das sichtbare Polygon, wenn der untersuchte Bereich einfach ist, also nicht 


weiter aufgeteilt zu werden braucht. 


area(xstart,ystart,xend,yend) bestimmt 


den durch die Punkte (xstart,xend) und (ystart,yend) beschriebenen Bereich. 
overlap(p,b) stellt fest, ob die Projektion von Polygon p mit dem Bereich b über- 
lappt. surround(p,b) überprüft, ob p den Bereich b vollständig umgibt. midpoint(b) 
berechnet den Mittelpunkt von b. any_overlap_point(p,p-akt) bestimmt einen belie- 
bigen Punkt der Überlappung der Projektionen von p und p.akt. intersect_projector 
ist in Abbildung 4.4 erklärt. 
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Abbildung 4.19: Anwendung des Flächenunterteilungs-Algorithmus auf eine einfache 
Beispielszene unter Verwendung einer regelmäßigen Aufteilung (vgl. [FvDFH90]). Der 
Algorithmus stoppt hier spätestens nach 4 Unterteilungsschritten. 
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Abbildung 4.20: Anwendung des Flächenunterteilungs-Algorithmus bei Verwendung ei- 
ner ungleichmäßigen Aufteilung unter Zuhilfenahme der Polygonknoten (vgl. [FvDFH90)). 
Die erste Aufteilung erfolgt anhand Knoten A, die zweite anhand Knoten B. 
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tiert man die Polygone nach ihren minimalen z-Werten und benutzt das am 
nächsten zum Betrachter liegende Polygon P für die erste Aufteilung. Alle 
anderen Polygone werden bzgl. P abgeschnitten und das Verfahren wird auf 
die verbleibenden Polygonteile rekursiv angewendet. Dieses Vorgehen führt für 
einfache Szenen oft zu einer Reduzierung der Laufzeit, hat aber für komplexe 
Szenen wenig Vorteile. 


Der Flächenunterteilungs-Algorithmus arbeitet fast ausschließlich im Bildraum. 
Nur die Rückwärtsprojektion findet im Objektraum statt. 


4.7 Vergleich der Verfahren 


Nach [SSS74] führen alle vorgestellten Algorithmen eine Sortierung auf den 
darzustellenden Objekten durch und nutzen die Kohärenz der Objekte in un- 
terschiedlicher Art und Weise aus, vgl. auch [FvDFH90]. In [SSS74] werden die 
Algorithmen nach der Reihenfolge der Dimensionen klassifiziert, in der sie die 
Sortierung vornehmen. Die Scangeraden-Algorithmen sortieren mittels bucket 
sort zuerst in y (Aufbau der Liste der passiven Kanten) und danach in x (Ver- 
waltung der Liste der aktiven Kanten). Die durchgeführte Rückwärtsprojektion 
entspricht einer Sortierung in z. Die Scangeraden-Algorithmen werden daher 
als yez-Algorithmen klassifiziert. Der Flächenunterteilungs-Algorithmus sucht 
durch die rekursive Unterteilung der Projektionsebene parallel in x und y und 
führt danach eine Sortierung in z durch. Er ist also ein (zy)z-Algorithmus”. 


In [SSS74] werden auch die meisten der hier vorgestellten Verfahren in den da- 
mals verfügbaren Versionen getestet. Dabei werden eine einfache Szene (200 
Oberflächen), eine Szene mittlerer Komplexität (5000 Oberflächen) und eine 
Szene hoher Komplexität (120000 Oberflächen) verwendet. Die meisten der 
verwendeten Oberflächen sind rechteckig. Die Algorithmen werden dadurch 
verglichen, daß die einzelnen Operationen abhängig von ihrer Komplexität Ko- 
sten von 1, 10 oder 100 erhalten. Dies ist zwar eine sehr grobe Abschätzung, 
die erhaltenen Kosten können aber einen ersten Anhaltspunkt dafür geben, 
welcher der Algorithmen für welche Komplexitätsstufe geeignet ist. Tabelle 4.1 
zeigt die erhaltenen Kostenwerte. Man beachte, daß wegen der Grobheit der 
Kostenabschätzung ein Faktor von 2 wenig aussagekräftig ist. Dagegen kann 
aus einem Faktor von 10 schon eher eine Schlußfolgerung gezogen werden. Ta- 
belle 4.1 zeigt, daß der depth-sort-Algorithmus gut geeignet ist für Szenen mit 
wenigen Objekten. Für komplexe Szenen steigen die Kosten des Algorithmus 


”Wenn in zwei Dimensionen parallel gesucht wird, wird dies mit umschließenden Klammern 
dargestellt. 
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Aleorithmus Anzahl der polygonalen Oberflächen 
® 5.000 120.000 


depth-sort 

z-Puffer 

Scangerade 
Flächenunterteilung 





Tabelle 4.1: Kostenwerte der vorgestellten Algorithen nach [55574]. Der aufgeführte 
depth-sort-Algorithmus stellt überlappende Polygone korrekt dar. 


aber stark an, weil viele Oberflächen aufgeteilt werden müssen. Der z-Puffer- 
Algorithmus hat unabhängig von der Komplexität der Szene konstante Kosten. 
Dies liegt daran, daß mit steigender Anzahl der Oberflächen die Anzahl der von 
den einzelnen Oberflächen abgedeckten Pixel üblicherweise geringer wird. Da- 
mit erscheint der z-Puffer-Algorithmus für Szenen geringer Komplexität etwas 
aufwendig, zeigt aber für Szenen mittlerer und hoher Komplexität sehr geringe 
Kosten. Der große Vorteil des z-Puffer-Algorithmus liegt darin, daß die Ko- 
sten mit steigender Komplexität kaum ansteigen. Der Nachteil des Algorithmus 
besteht darin, daß er nur mit großem Aufwand zur Darstellung von transpa- 
renten Objekten verwendet werden kann: wenn für ein Pixel ein transparentes 
Objekt am nächsten zum Betrachter liegt, muß zur Bestimmung der korrekten 
Pixelintensität auch das dahinter liegende Objekt berücksichtigt werden. Dafür 
reicht der z-Puffer nicht aus. Der Scangeraden-Algorithmus ist der einzige 
der vorgestellten Algorithmen, der für alle Komplexitätsstufen gleichmäßig gut 
geeignet ist. Der Flächenunterteilungs-Algorithmus scheint dagegen für keine 
Stufe richtig geeignet zu sein. 


Kapitel 5 


Reflexions- und 
Beleuchtungsmodelle 


Ein Ziel der Computergraphik ist es, Objekte so zu modellieren und auf einem 
Ausgabemedium darzustellen, daß sie von realen Objekten möglichst nicht zu 
unterscheiden sind. Das Aussehen von realen Objekten hängt u.a. von ihren 
Material- und Oberflächeneigenschaften ab, ebenso von der Farbe und der In- 
tensität des einfallenden Lichtes. Außerdem spielt die Lage der Objekte und 
der Lichtquellen und deren Geometrie eine Rolle. Zur Modellierung der Ob- 
jekte müssen alle diese Faktoren und die Wechselwirkungen zwischen ihnen 
berücksichtigt und möglichst genau nachgebildet werden. Dazu werden in der 
Computergraphik Beleuchtungsmodelle und Reflexionsmodelle verwendet. 


Ein Beleuchtungsmodell beschreibt die Eigenschaften des einfallenden Lichtes 
wie z.B. dessen Farbverteilung und Helligkeit sowie der Geometrie der Licht- 
quelle. Ein Reflerionsmodell beschreibt, wie die Oberfläche eines Objektes mit 
dem einfallenden Licht wechselwirkt, d.h. ob und wie das einfallende Licht 
reflektiert oder transmittiert (d.h. durchgelassen) wird. Dies ist u.a. davon 
abhängig, ob das Objekt durchscheinend ist oder nicht, ob die Oberfläche eher 
spiegelnd oder eher matt ist und welche Struktur sie hat. Prinzipiell versuchen 
die Beleuchtungs- und Reflexionsmodelle physikalische Vorgänge zu simulie- 
ren. Da diese jedoch, soweit überhaupt erforscht, sehr komplex sind und nur 
mit großem Aufwand berechnet werden können, sind in den in der Compu- 
tergraphik verwendeten Modellen diverse Vereinfachungen enthalten, die den 
Aufwand auf ein erträgliches Maß reduzieren. Wir werden im folgenden die 
gebräuchlichsten dieser Modelle vorstellen. Gute Beschreibungen der hier vor- 
gestellten Modelle findet man auch in [Wat89] und [FvDFH90]. Weitere Modelle 
sind z.B. in [BG89) und vor allem in [Hal89] ausführlich beschrieben. Um dem 
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Leser einen Einblick in die zugrundeliegenden physikalischen Mechanismen zu 
geben, werden wir im nächsten Abschnitt zuerst einige physikalische Grundlagen 
auffrischen. 


5.1 Physikalische Grundlagen 


Ein Ziel der physikalischen Forschung ist es, ein Modell des Phänomens Licht 
zu entwickeln, das die beobachteten Erscheinungen und Gesetzmäßigkeiten in 
möglichst einfacher Weise beschreibt. Dabei ist klar zu unterscheiden zwischen 
den objektiven Vorgängen, die sich außerhalb des menschlichen Auges abspie- 
len, und der subjektiven Wahrnehmung, die die zwischen Auge und Gehirn 
sich vollziehenden Vorgänge umfaßt. Die objektiven Vorgänge sind Gegen- 
stand der physikalischen Forschung, die subjektive Wahrnehmung wird von der 
Physiologie und Psychologie untersucht. Wir werden uns in diesem Abschnitt 
hauptsächlich mit den physikalischen Eigenschaften des Lichtes beschäftigen. 
Einzelheiten zur physiologischen Wahrnehmung des Lichtes findet man z.B. in 
[GKV77], [FvDFH90] und [GW92]. 


Zur physikalischen Beschreibung des Lichts gibt es ein Wellenmodell und ein 
Teilchenmodell. Da keines dieser Modelle sämtliche Eigenschaften des Lichts 
vollständig beschreiben kann, werden beide Modelle nebeneinander verwendet, 
man spricht vom Welle-Teilchen-Dualismus. Je nach zu erklärendem Phäno- 
men wird das eine oder das andere Modell benutzt. 


Das Wellenmodell beschreibt Licht als elektromagenetische Welle, die sich im 
Vakuum mit Lichtgeschwindigkeit c = 3: 10®m/s ausbreitet. Die Eigenschaften 
werden durch die Maxwellschen Gleichungen beschrieben!, vgl. z.B. [GKV77]: 


Hd = Kasie (5.5) 


rt H = = + 45.1) K sB 
: Eds = —dÄ (5.6) 
OD s dt 
rot E + a” 0 (5.2) K 
divD = 0 (5.3) $Dai = Q (5.7) 
vB = 0 4 BadÄ = 0 (5.8) 
S 


!Die angegebenen Gleichungen setzen die Verwendung des rationalisierten MSKA- 
Einheitensystems voraus. Bei Verwendung des cgs-Systems ergeben sich geringfügig andere 
Gleichungen. 


5.1. PHYSIKALISCHE GRUNDLAGEN 193 


En CE CE CE 
Vakuum 1 2.998 : 10°m/s 1 
Luft 1.00059 | 2.977 - 10°m/s 1.0029 
Plexiglas 3 1.731 - 10°m/s 1.732 

Glas 2 bis 16 | 2.119 10° bis 0.749 - 10°m/s | 1.414 bis 4 
Wasser 80.3 2.249 : 10°m/s 1.333 
keramische Stoffe | über 100 | < 0.229 - 10°m/s >10 


































Tabelle 5.1: Dielektrizitätszahl e, Geschwindigkeit des Lichtes v und Brechzahl n für 
einige Stoffe. 


Links ist die differentielle, recht die integrale Form angegeben?. Dabei ist j die 
Stromdichte, p ist die Ladungsdichte. #7 ist die magnetische, E ist die elektri- 
sche Feldstärke. B ist die magnetische, D ist die elektrische Flußdichte. (5.5) 
besagt, daß Ströme und zeitlich veränderliche, elektrische Felder von magneti- 
schen Wirbelfeldern umschlossen sind. (5.6) besagt, daß zeitlich veränderliche 
Magnetfelder von elektrischen Wirbelfeldern umschlossen sind. (5.7) besagt, 
daß eine ruhende elektrische Ladung ein elektrisches Quellenfeld erzeugt. (5.8) 
besagt, daß es keine magnetischen Quellenfelder gibt. Aus den Maxwell’schen 
Gleichungen folgt, daß elektromagnetische Wellen transversal sind und daß E 
senkrecht auf H bzw. D senkrecht auf B steht. Alle diese Vektoren stehen 
senkrecht auf der Ausbreitungsrichtung der Welle. Im Vakuum breiten sich 
elektromagnetische Wellen mit der Geschwindigkeit c = 2.998 - 10°m/s aus, in 
Materie mit der Geschwindigkeit v = c./en (Maxwell-Relation). Dabei ist e 
die materialabhängige Dielektrizitätszahl, u ist die materialabhängige Permea- 
bilitätszahl. In der Optik wirdn = c/v = 1/,/ep auch als Brechzahl bezeichnet. 
Tabelle 5.1 enthält einige typische Werte ° für e und n, der Wert von u liegt für 
die meisten Materialien bei 1. 


Mit dem Wellenmodell können alle bei der Lichtausbreitung feststellbaren Er- 
scheinungen wie Brechung, Dispersion, Streuung, ebenso wie Interferenz- und 
Polarisationserscheinungen erklärt werden. Die bei der Wechselwirkung von 
Licht mit Materie auftretenden Phänomene (Photoeffekt, Compton-Effekt, 


2Dabei ist in (5.5) und (5.6) $, ein Integral über die Kurve K, die die im Integral |, 
verwendete Fläche 5 umschließt. Für die Integration wird der Stoke’sche Satz verwendet und 
es ist [, jdA= I. In (5.7) und (5.8) ist $, ein Integral über die Oberfläche, die das Volumen 
V umschließt, über das auf der rechten Seite integriert wird. Für die Integration wird der 
Gauß’sche Satz verwendet und es ist [, pdV =Q. 

3Für Wasser ist die Maxwell’sche Gleichung wegen auftretenden Dispersionseffekten nicht 
erfüllt, vgl. [GKV77]. 
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Emission und Absorption von Licht) können mit dem Wellenmodell aber nicht 
befriedigend erklärt werden. Daß bei der Emission von Licht durch Materie 
nur bestimmte scharfe Frequenzen ausgestrahlt werden, läßt sich nur mit dem 
Teilchenmodell beschreiben, das in der Quantenmechanik entwickelt wurde, 


vgl. [Mes76). 


Das Teilchenmodell nimmt an, daß monochromatisches Licht der Frequenz v 
aus einzelnen, unteilbaren Lichtquanten oder Photonen besteht, die sich mit 
Lichtgeschwindigkeit c gradlinig gewegen. Die Photonen sind masselose Teil- 
chen, deren Energie E proportional zur Frequenz v des Lichtes ist: E = hv. 
Dabei ist h = 6.6 : 10”°*Js die Planksche Konstante. Die Energie eines Pho- 
tons ist unabhängig von seiner Entfernung von der Lichtquelle, es findet keine 
Abschwächung statt. 


Materie besteht aus einzelnen Atomen, ein Atom besteht aus Atomkern und 
Atomhülle. Der Atomkern enthält die Protonen und Neutronen des Atoms, 
die Atomhülle ist der Aufenthaltsort der zu einem Atom gehörenden Elek- 
tronen. Die Elektronen eines Atoms können bestimmte diskrete stationäre 
Zustände annehmen, die eine wohldefinierte Energie besitzen (Energieviveaus). 
Durch Absorption bzw. Emission von Energie kann ein Elektron in ein höheres 
bzw. niedrigeres Energieviveau überführt werden. 


Beim Auftreffen auf Materie teilt ein Photon seine Energie spontan einem getrof- 
fenen Elektron der Materie mit. Je nach Energie des Photons wird das Elektron 
entweder aus dem Atomverband herausgelöst oder wird auf ein höheres Energie- 
niveau gehoben. Im letzteren Fall befindet sich das zugehörige Atom in einem 
angeregten Zustand. Wenn die Energie des Photons nicht ausreicht, ein Elek- 
tron auf ein höheres Energieniveau zu heben, wird die Energie des Photons 
in Wärme umgewandelt. In jedem Fall wird das Photon absorbiert, die Licht- 
strahlung wird abgeschwächt. Üblicherweise verweilen die Atome nicht lange im 
angeregten Zustand. Das angeregte Elektron kehrt wieder auf sein ursprüngli- 
ches Energieniveau zurück. Die dabei freiwerdende Energie E wird als Photon 
der Frequenz v = E/h abgegeben, d.h. es wird Licht emittiert. 


In der Quantenmechanik wird der Welle-Teilchen-Dualismus des Lichtes formal 
aufgehoben, indem Photonen keine exakt vorausberechneten Bahnen, sondern 
Aufenthaltswahrscheinlichkeiten zugeordnet werden. Die Verbindung zum Wel- 
lenmodell besteht darin, daß die Aufenthaltswahrscheinlichkeit proportional zur 
Intensität der Lichtwelle ist, die im Wellenmodell verwendet wird, d.h. zum Qua- 
drat der Wellenamplitude. 
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Abbildung 5.1: Berechnung der effektiven Fläche dS’ zum Flächenelement dS. Es gilt 
sin(90 — 5) = cos6 = dS’/dS. | 


5.2 Strahlungslehre 


Wir werden in diesem Abschnitt kurz einige Definitionen der Strahlungslehre 
wiederholen, die in diesem und den folgenden Kapiteln eine Rolle spielen, 


vel. [GKV77). 


Eine Strahlungsquelle gibt in den ganzen Raum eine gewisse Strahlungsleistung 
® ab, auch Strahlungsfluß genannt. Die Strahlungsleistung wird in Watt = 
Joule/sec gemessen und entspricht im Teilchenmodell der Anzahl der Photo- 
nen, die die Strahlungsquelle pro Zeiteinheit verlassen. Der gesamte Energie- 
verlust, den eine Quelle durch ihre Strahlung erleidet, wird als Strahlungsmenge 
W bezeichnet. Die Strahlungsmenge wird in Joule gemessen und ergibt sich als 
W = [ Ödt. Nur in Ausnahmefällen verteilt sich der Strahlungsfluß gleichmäßig 
über alle Winkel. In diesem Fall spricht man von einem isotropen Strahler. 
Üblicherweise fällt in einen kleinen Raumwinkel* dQ) je nach Lage ein unter- 
schiedlicher Anteil der Strahlungsleistung, die Strahlungsstärke J = dÖ/dN ist 
also winkelabhängig. Der gesamte Strahlungsfluß ergibt sich als ® = [ JdQ 
über alle Richtungen. Für isotrope Strahler ist ® = 4 J. 


Die einzelnen Flächenstücke d$ eines ausgedehnten Strahlers leisten 1.a. Beiträge 
d® zum Gesamt-Strahlungsfluß, die nicht allein der Größe d$ proportional sind. 
Die spezifische Ausstrahlung R = d®/dS‘, gemessen in W/m?, kann verschieden 


“Ein Raumwinkel ist durch das Verhältnis des über ihm aufgespannten Kugelflächenteils 
zum Quadrat des Radius r der Kugel gegeben. Die Einheit wird manchmal Steradiant (sr) 
genannt. Da die Oberfläche einer Kugel gleich 4rr? ist, bestimmt die gesamte Kugel den 
Raumwinkel 4rr?/r? = 4r. 
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m Abbildung 5.2: Ausstrahlung oder 
Reflexion eines Flächenelements dS 
nach dem Lambert’schen Gesetz. Die 
Länge der Pfeile gibt die Größe der 

\, Strahlungsstärke in die entsprechende 
Richtung an. 


groß sein. Ein Flächenstück d$ gibt auch üblicherweise nicht in alle Richtungen 
die gleiche Strahlungsstärke ab. Die Strahlungsdichte B mißt den Beitrag des 
Flächenstücks unter einem Winkel ö zur Normalen von d$. Da die Fläche d$ aus 
der Richtung ö betrachtet um den Faktor 1/cosö verkürzt erscheint, wird zur 
Festlegung von B die effektive Fläche dS’ = dS cos ö verwendet, vgl. Abbildung 
5.1. Damit ist B= dJ/(dScos6). Ein Strahler heißt Lambert-Strahler, wenn er 
in alle Richtungen des Raumes gleich viel Strahlung aussendet: dJ = Bd$ cos 6. 
Abbildung 5.2 veranschaulicht dies. Eine solche Fläche sendet in den gesamten 
Halbraum? die Strahlungsleistung 


o= [Ja 


n/2 
SL Bcos6ösinöddd6ö 


n/ [2 
27 BdS je cos ö sin 6 dö 
0 
a BdS 


Dabei ist dN = sin ö dö d# die von einem differentiellen Raumwinkel abgedeckte 
Fläche auf der Einheitskugel, vgl. Abbildung 5.3. 


Die bisherigen Größen bezogen sich auf den Strahler selbst. Wir werden jetzt 
eine Fläche behandeln, die Strahlung empfängt. Eine Fläche dS, die an einem 
bestimmten Ort ım Strahlungsfeld steht, empfängt je nach Einstellwinkel ver- 
schieden viel Strahlungsleistung. Sie empfängt die meiste Strahlungsleistung, 
wenn sie senkrecht zur Strahlung steht (6 = 0).*. Wenn sie in dieser Stel- 
lung die Strahlungsleistung d® empfängt, herrscht am entsprechenden Ort eine 


5Üblicherweise geht man davon aus, daß eine Fläche S nur in einen Halbraum abstrahlt, 
d.h. nur aufeiner Seite der Ebene, in der $ liegt. Diese Annahme ist insbesondere dann sinn- 
voll, wenn $ als Oberfläche eines Objektes verwendet wird, was wir im folgenden annehmen. 
61m Teilchenmodell wird das einfallende Licht als Strahl von Photonen interpretiert, deren 
Anzahl die Strahlungsmenge und damit auch die Intensität bestimmt. d$ wird von umso mehr 
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Abbildung 5.3: Integration über 
eine Halbkugel: 6 durchläuft die Win- 
kel zwischen 0 und =/2, & durchläuft 
die Winkel zwischen 0 und 2r. 





Intensität oder Strahlungsflußdichte D = d®/dS. Bei anderen Einstellungen 
ist wieder die effektive Fläche entscheidend. Die empfangene Strahlungslei- 
stung ist dd = DdScosd. Im Teilchenmodell kann die Intensität als Photo- 
nendichte aufgefaßt werden. Da die Photonen sich mit der Geschwindigkeit c 
gleichförmig, gradlinig bewegen, entspricht die Photonendichte der Anzahl der 
auf ein Flächenelement dS pro Zeiteinheit auftreffenden Photonen. Wenn B 
die Strahlungsdichte der verwendeten Lichtquelle ist, ist D = Bdß} die Inten- 
sität des auf ein Flächenelement auftreffenden Lichtes. Die von d$ empfangene 
Strahlungsleistung ist dd = BdNdS cos ö, die auf dS herrschende Intensität ist 


D = dÖ/dS = Bdllcosö (5.9) 


Dabei ist ö der Winkel zwischen dem Normalenvektor rn von dS und dem zur 
Lichtquelle zeigenden Vektor L. 


Wenn keine Absorption stattfindet, reflektiert eine Fläche die empfangene 
Strahlung wieder. Dabei erscheint eine sehr matte Fläche (z.B. eine sehr 
matt geschliffene ebene Gipsplatte) dem Betrachter aus allen Richtungen gleich 
hell, d.h. ihre Strahlungsdichte hat unabhängig von der Betrachterposition den 
Wert Bo. Aus dem Winkel 6 betrachtet hat eine Fläche d$ die effektive Größe 
dS' = dS$ cos6, vgl. Abbildung 5.1. Die Strahlungsstärke dJ in Richtung ö ist 


damit 


dJ(6) = BodS" = BodS cos 6 (5.10) 


Diese Proportionalität zu cos6 wird als Lambert-Gesetz bezeichnet. Es ist 
streng erfüllt für die Strahlung eines schwarzen Körpers und gilt annähernd 


Photonen getroffen, je mehr d$ in den Photonenstrahl gedreht wird. Wenn dS parallel zum 
Photonenstrahl steht, wird sie von keinem der Photonen getroffen. Wenn dS$ senkrecht zum 
Photonenstrahl steht, wird sie von maximal vielen Photonen getroffen. 
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physikalisch: Strahlung physiologisch: Licht 
Gröte _ T Symbol] Binhee — | Größe | Symbol | Einheit“ 


Strahlungsenergie Lichtmenge | Q 
Ö 
I 
B 
D 


Strahlungsfluß Lichtstrom 
Strahlungsstärke Lichtstärke 

Tabelle 5.2: Physikalische und physiologische Strahlungsgrößen. Im steht für Lumen, 

cd für Candela, Ix für Lux. Es ist cd = Im/sterad und Iz = Im/m?. 





























W/sterad 
W/(m?. sterad) 
W/m? 





Strahlungsdichte Leuchtdichte 
Intensität Intensität 








für sehr matte Oberflächen. Trägt man die Strahlungsstärke, die ein Lam- 
bertsches Flächenelement d$ in die verschiedenen Raumrichtungen wirft, als 
entsprechend lange Pfeile im Mittelpunkt von dS auf, so liegen deren Spitzen 
auf einer Kugel, die dS in dessen Mittelpunkt berührt, vgl. Abbildung 5.2. Für 
Flächenelemente, die nicht exakt dem Lambertschen Gesetz gehorchen, ist diese 
Kugel in Normalenrichtung in die Länge gezogen. 


Aus dem großen Bereich des elektromagenetischen Spektrums kann das mensch- 
liche Auge nur einen sehr kleinen Ausschnitt wahrnehmen, nämlich etwa den Be- 
reich zwischen 360 und 750 nm Wellenlänge. Die einzelnen Teile des sichtbaren 
Spektrums werden darüber hinaus mit sehr ungleicher Empfindlichkeit wahr- 
genommen. So ist das menschliche Auge? für Karminrot (750 nm) 10000 Mal 
weniger empfindlich als für Zitronengelb (550 nm). Wie eine bestimmte Stahl- 
ungsmenge physiologisch bewertet wird, hängt also entscheidend von ihrer spek- 
tralen Zusammensetzung ab. Beispielsweise wird eine Fläche von Im?, auf die 1 
Watt monochromatisches gelbgrünes Licht auftrifft, als Beleuchtungsstärke von 
680 Lux empfunden. Die gleiche Bestrahlungsstärke mit rotem Licht wird nur 
als Beleuchtungsstärke von 0.1 Lux empfunden. Jede der oben beschriebenen 
physikalischen Strahlungsgrößen hat ihr physiologisches Gegenstück, vgl. Ta- 
belle 5.2. 


Wenn Licht auf ein teilweise durchsichtiges Objekt trifft, so wird ein Teil (spie- 
gelnd oder diffus) reflektiert, ein Teil tritt in das Objekt ein und wird auf 
dem Weg durch das Objekt je nach dessen Eigenschaften teilweise absorbiert. 
Je nach Material kann es auch zu Fluoreszenz- oder Phosphoreszenz-Effekten 
kommen. Ebenso können Streueffekte auftreten. Beim Verlassen des Objektes 
kann ein Teil des Lichtes intern reflektiert werden, der Rest tritt wieder aus 
dem Objekt aus. Der Vorgang ist in Abbildung 5.4 veranschaulicht. In der 
Computergraphik wird meist nur die stattfindende Reflexion und Transmission 


im helladaptierten Zustand 


9.2. STRAHLUNGSLEHRE 199 


einfallendes Licht 








f gestreut 


transmittiert 


spiegelnd interne Reflexion 


Abbildung 5.4: Veranschaulichung der Interaktion von Licht mit einem teilweise trans- 
parenten Medium. 


nachgebildet, die Absorptions- und Streueffekte bleiben meist unberücksichtigt. 
Die Intensität und Wellenlänge des reflektierten und transmittierten Lichtes ist 
von vielen Faktoren abhängig wie z.B. der Wellenlänge des einfallenden Lichtes, 
dem Einfallswinkel, der Oberflächenbeschaffenheit und den Materialeigenschaf- 
ten des Objektes, die ebenfalls abhängig sind von der Wellenlänge des einfal- 
lenden Lichtes. Die genaue Wechselwirkung ist sehr komplex und kann in der 
Computergraphik auch nicht annähernd exakt simuliert werden, weil dies die 
Rechenkapazität der heutigen Rechner bei weitem übersteigt. Statt dessen muß 
man sich mit mehr oder weniger guten Vereinfachungen begnügen, die wir im 
folgenden vorstellen wollen. 


Zur Beschreibung der diffusen Reflexion nimmt man üblicherweise an, daß das 
Lambert’sche Gesetz (5.10) gilt. Für die Beschreibung der spiegelnden Re- 
flexion und Transmission ist es in vielen Fällen ausreichend, die Gesetze der 
geometrischen Optik anzuwenden?, vgl. z.B. [H576] und [GKV77]. 


Fällt ein Lichtstrahl auf eine ebene Grenzfläche zwischen zwei optisch verschie- 
denen Medien, so wird es zum Teil oder auch vollständig reflektiert, vgl. Abbil- 
dung 5.5. Der reflektierte Strahl liegt in der Ebene, die durch den einfallenden 
Strahl und den Normalenvektor n ım Auftreffpunkt gebildet wird. Einfalls- 
winkel &; und Ausfallswinkel &g sind gleich: &ı = «@. Wenn das Licht nicht 
vollständig reflektiert wird, tritt der nicht reflektierte Anteil bei schrägem Auf- 


8Die geometrische Optik arbeitet mit Lichtstrahlen, die die Ausbreitungsrichtung des Lich- 
tes angeben. Es wird immer eine gradlinige Ausbreitung des Lichtes angenommen. 
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Abbildung 5.5: Reflexion und 
Brechnung eines Lichtstrahles an ei- 
Grenzfläche nem teilweise transparenten Medium 
für nı < no. 






nz 


treffen unter Richtungsänderung in das andere Medium ein, falls dieses trans- 
parent ist. Der gebrochene Strahl liegt ebenfalls in der Ebene, die durch den 
einfallenden Strahl und den Normalenvektor im Auftreffpunkt gebildet wird. 
Für den Brechnungwinkel $ gilt bei Verwendung monochromatischen Lichtes 
und isotroper Medien das Snell’sche Brechungsgesetz: 


sine n2_ 
sinß = n1 = n 

Dabei ist nı die Brechzahl des Mediums, aus dem das Licht einfällt, nz ıst 
die Brechzahl des Mediums, in das das Licht gebrochen wird. Wenn das Licht 
vom optisch dünneren Medium auf die Grenzfläche trifft, nı < na, wird der 
gebrochene Strahl zum Einfallslot hin gebrochen. Wenn das Licht vom optisch 
dichteren Medium auf die Grenzfläche trifft, nı > na, wird der gebrochene Strahl 
vom Einfallslot weg gebrochen. Im letzteren Fall tritt Totalreflerion auf, wenn 
ein Grenzwinkel &; überschritten wird. a; errechnet sich aus dem Snell’sche 
Gesetz: 


sin & ng 





nz 
— => ına=— 
sinm/2 nı nı 


Für Einfallswinkel größer als &, kann keine Brechung mehr erfolgen, es tritt kein 
Licht in das optisch dünnere Medium ein. 


5.3 Das Phong-Reflexionsmodell 


Das Phong-Reflexionsmodell, vgl. [Pho75], [Wat89], [BG89], [FvDFH90], wird 


in der Computergrafik sehr häufig verwendet. Es liefert für viele Anwendungen 
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bei geringem Berechnungsaufwand befriedigende Ergebnisse. Ziel jedes Reflexi- 
onsmodells ist es, die von einer Oberfläche in Richtung des Betrachters abgege- 
bene Lichtintensität ] zu bestimmen. Das Phong-Reflexionsmodell nimmt an, 
daß das Licht das Auge des Betrachters auf drei Arten erreichen kann: 


e Das Licht kommt direkt von einer Lichtquelle und wird von der betrach- 
teten Oberfläche spiegelnd reflektiert. 


e Das Licht kommt direkt von einer Lichtquelle und wird von der betrach- 
teten Oberfläche diffus reflektiert. 


e Das Licht wird von anderen Oberflächen evtl. mehrfach spiegelnd reflek- 
tiert. 


Als Lichtquellen werden Punkt-Lichtquellen angenommen. Die in Richtung des 
Betrachters abgegebene Lichtintensität ergibt sich als Summe dieser drei Kom- 
ponenten. Wir werden im folgenden darstellen, wie die einzelnen Komponenten 
beschrieben werden. 


5.3.1 Diffuse Reflexion 


Das menschliche Auge nimmt Objekte als farbig wahr, obwohl diese selbst kein 
Licht aussenden. Die physikalische Erklärung dafür ist, daß die Objekte das 
alle Farben beinhaltende weiße Tageslicht absorbieren und einen bestimmten 
Anteil wieder reflektieren. Eine grüne Oberfläche absorbiert alle Komponen- 
ten des weißen Lichts und reflektiert die grüne Komponente in alle Richtungen 
gleichmäßig, die Oberfläche erscheint aus allen Richtungen grün. Im Teilchen- 
modell läßt sich das so erklären, daß die Photonen einige der Elektronen auf ein 
höheres Energieniveau heben, beim Übergang zum ursprünglichen Energieni- 
veau werden Photonen einer Frequenz v erzeugt, die der Frequenz von grünem 
Licht entspricht. Mischfarben entstehen dadurch, daß das bestrahlte Material 
aus verschiedenen Atomen mit unterschiedlichen Energieniveaus besteht, die 
emittierten Photonen haben unterschiedliche Frequenz. Für die Computergra- 
phik ist weniger der genaue Mechanismus der Reflexion als die Tatsache wichtig, 
daß das Licht in alle Richtungen gleichmäßig reflektiert wird. Die beschriebene 
Art der Reflexion wird diffuse Reflexion genannt. Sehr matte Oberflächen sind 
perfekt diffus reflektierend, die Oberflächen haben unabhängig von der Position 
des Betrachters gleiche Farbe und gleiche Helligkeit. Die Intensität /4 des diffus 
abgestrahlten Lichtes kann mit dem Lambert’schen Gesetz, vgl. Abschnitt 5.1, 
berechnet werden: 
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Abbildung 5.6: Definition von % und L. 


I,=I.:kı: cos6 mit 0<6s< 


Dabei ist /. die Intensität des einfallenden Lichtes, 6 ist der Winkel zwischen 
dem Normalenvektor n der Oberfläche und der Richtung des einfallenden Lich- 
tes. k, ist der materialabhängige diffuse Reflerionskoeffizient, der angibt, wel- 
cher Anteil des einfallenden Lichtes diffus reflektiert wird. ka ist abhängig von 
der Wellenlänge des einfallenden Lichtes und liegt zwischen 0 und 1. Wenn L 
in Richtung der Lichtquelle zeigt, vgl. Abbildung 5.6, kann das Lambert’sche 
Gesetz auch formuliert werden als 


L=I-k-(R-L) 


Dabei müssen fi und Z normiert sein. Für mehrere Lichtquellen Li, Lx ad- 
dieren sich die einfallenden Intensitäten 7.1,‘ ‚Ie,k: 


k 
I=ka) I (RL) 


i=1 


Für punktförmige Lichtquellen nimmt die Intensität des einfallenden Lichtes 
mit dem Abstand von der Lichtquelle ab. Das führt dazu, das von zwei iden- 
tischen Objekten dasjenige mit größerem Abstand von der Lichtquelle dunkler 
erscheint. In dem bisher beschriebenen Modell wird dies noch nicht berücksich- 
tigt. Dies hat auch den Nachteil, daß bei Verwendung des bisherigen Modells 
zwei zueinander parallele Oberflächen mit gleichem Reflexionskoeflizient iden- 
tisch dargestellt werden. Wenn eine Oberfläche die andere teilweise verdeckt, 
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kann in der Darstellung nicht unterschieden werden, wo die eine Oberfläche 
aufhört und die andere anfängt. Man versucht deshalb, den Abstand von der 
Lichtquelle in das Modell miteinzubeziehen. 


Wenn r’ der Abstand zwischen Lichtquelle und Oberfläche ist und r der Abstand 
zwischen Oberfläche und Betrachter, dann fällt die Intensität des Lichtes mit 
R? = (r'+r)? ab. Dies läßt sich im Teilchenmodell dadurch erklären, daß sich 
alle zum gleichen Zeitpunkt t abgegebenen Photonen zum Zeitpunkt t’ > t auf 
einer Kugeloberfläche mit Radius r =c- (t’— t) befinden. Mit fortschreitender 
Zeit werden die Photonen auf eine immer weiter wachsende Kugeloberfläche 
verteilt. Die Intensität des Lichtes, d.h. die Photonendichte nimmt proportional 
zur Kugeloberfläche ab, d.h. mit 4rr?. 


Eine Übernahme dieses quadratischen Zusammenhangs in das Reflexionsmo- 
dell hat zwei Nachteile. Zum einen kommt auf einer Oberfläche kein Licht an, 
wenn die Lichtquelle im Unendlichen liegt.” Zum anderen führt der Abfall mit 
R? dazu, daß bei kleinem Abstand zwischen der Lichtquelle und den Objekten 
zwei dicht benachbarte Objekte evtl. mit sehr unterschiedlicher Helligkeit darge- 
stellt werden. Bei großem Abstand zwischen der Lichtquelle und den Objekten 
werden zwei dicht benachbarte Objekte dagegen mit fast der gleichen Helligkeit 
dargestellt. Beide Darstellungen wirken unecht, obwohl sie für Punktlichtquel- 
len korrekt sind. Dies liegt vor allem daran, daß die in der Realität verwendeten 
Lichtquellen keine reinen Punktlichtquellen sind, sondern eine Ausdehnung ha- 
ben. Eine mögliche Abhilfe liegt darin, anstatt R? den Wert r+k, vgl. [Wat89], 
oder kı +k,R+kzR?, vgl. [FvDFH90], zu verwenden. k bzw. kı, ka, und kz sind 
geeignet zu wählende Konstanten, die je nach gewünschtem Effekt zwischen 0 
und 1 gewählt werden. Damit erhält man den folgenden Wert für die diffus 
reflektierte Intensität: 


I= Teinf Ja ‘ kaln ' L) 


fa =1/(r+k) bzw. fa = 1/(kı + kaR+ kzR?) ist der gewählte Abschwächungs- 
faktor. 


5.3.2 Licht aus der Umgebung 


Eine Oberfläche, die parallel zur Richtung des einfallenden Lichtes liegt, re- 
flektiert nach dem bisher beschriebenen Mechanismus der diffusen Reflexion 
kein Licht, die Oberfläche wird vollkommen unbeleuchtet, d.h. schwarz darge- 
stellt. In der Realität wird eine solche Oberfläche trotzdem sichtbar sein. Es 


9Dies nimmt man oft an, um parallele Lichtstrahlen zu erzeugen. 
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fällt zwar kein direktes Licht auf sie, aber von anderen Objekten oder Wänden 
(evtl. mehrfach) reflektiertes Licht erreicht die Oberfläche trotzdem und wird 
in Richtung des Betrachters reflektiert. Die Oberfläche ist indirekt beleuchtet, 
erscheint also nicht ganz schwarz. Im Phong-Modell wird dieser Effekt durch 
eine Umgebungslicht-Komponente beschrieben. Dies ist ein Term /, - k,, der 
zur diffus reflektierten Intensität addiert wird: 


T=l1,-katlanf' fa kalt: L) 


I, ist die für die gesamte Umgebung als konstant angenommene Umgebungslicht- 
Intensität, die die Intensität der indirekten Beleuchtung angibt. k, ist der mate- 
rialabhängige Umgebungs-Reflexionskoeffizient, der zwischen 0 und 1 liegt und 
der empirisch so bestimmt wird, daß die gewünschte Darstellung entsteht. Man 
beachte, daß k, keiner physikalischen Eigenschaft des Oberflächenmaterials di- 
rekt entspricht, sondern nur zur Erleichterung der Beschreibung verwendet wird. 
Die Approximation liegt hier darin, daß das globale Phänomen der mehrfachen 
Reflexionen durch einen lokalen Term beschrieben wird, und daß /, unabhängig 
vom betrachteten Objekt als konstant angenommen wird, obwohl dessen Lage 
eine entscheidende Auswirkung auf den Einfluß der indirekten Beleuchtung hat. 


5.3.3 Spiegelnde Reflexion 


Die meisten in der Realität auftretenden Oberflächen sind nicht vollkommen 
matt. Das einfallende Licht wird daher nicht nur diffus, sondern auch spiegelnd 
reflektiert. Die spiegelnde Reflexion wird im Phong-Reflexionsmodell in einigen 
Punkten anders als die diffuse Reflexion behandelt: 


e Das von einer Oberfläche spiegelnd reflektierte Licht verläßt diese nur 
unter dem Winkel @, unter dem das Licht einfällt (Einfallswinkel = Aus- 
fallswinkel), vgl. Abbildung 5.7. Damit ist das reflektierte Licht bei per- 
fekt spiegelnder Reflexion nur aus einer bestimmten Betrachterposition 
sichtbar, für alle anderen Positionen erscheint die Oberfläche dunkel. 


eo Sei P ein Punkt auf einer perfekt spiegelnd reflektierenden Oberfläche mit 
Normalenvektor fi. Sei L der von der Lichtquelle zu P zeigende Vektor. 
Dann liegt der in Richtung des abgestrahlten Lichtes zeigende Vektor R 
in der vonund Z festgelegten Ebene. 


Im Gegensatz zu diffus reflektiertem Licht hat spiegelnd reflektiertes Licht 
nicht die Farbe der Oberfläche, sondern die Farbe des einfallenden Lichtes. 
Bei einem mit weißem Licht bestrahlten, grünen Objekt hat also das diffus 
reflektierte Licht grüne Farbe, das spiegelnd reflektierte Licht weiße Farbe. 


w 
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Abbildung 5.7: Definition von L, R, # und V bei der spiegelnden Reflexion. 


Die meisten in der Realıtät auftretenden Objekte sind nicht perfekt spiegelnd. 
Dies äußert sich darin, daß spiegelnd reflektiertes Licht nicht nur aus der für den 
perfekt spiegelnden Fall errechneten Richtung R gesehen werden kann, sondern 
auch aus benachbarten Richtungen. Das meiste Licht wird dabei in Richtung R 
abgestrahlt. In benachbarte Richtungen wird umso weniger Licht abgestrahlt, 
je weiter diese von R abweichen. Der Bereich einer Oberfläche, von dem ein- 
fallendes Licht spiegelnd in Richtung des Betrachters geworfen wird, wird als 
Schlaglicht (englisch highlight) bezeichnet. 


Sei V ein Vektor, der von dem betrachteten Punkt P der Oberfläche aus in Rich- 
tung des Beobachters zeigt und sei ö der Winkel zwischen Rund V, vgl. Abbil- 
dung 5.7. Im Phong-Modell wird die Tatsache, daß je nach den Eigenschaften 
der verwendeten Oberfläche Licht in Richtung v abgestrahlt wird, durch einen 
Term cos” & modelliert.‘ n € IN ist eine empirisch zu bestimmende Kon- 
stante, die von der betrachteten Oberfläche abhängig ist. n bestimmt, bis zu 
welchem Winkel d in Richtung V noch Licht abgestrahlt wird und wie steil der 
Abfall mit wachsendem d ist. Mit wachsendem n wird der entstehende Schlag- 
lichtbereich kleiner. Für einen perfekten Spiegel ist rn = oo. Mit Werten von 
n > 100 werden spiegelähnliche Oberflächen modelliert, mit n = 1 modelliert 
man das Verhalten von sehr matten Oberflächen. Wenn Rund V normiert sind, 
ergibt sich damit die in Richtung V abgestrahlte Gesamtintensität zu: 


Iges = Ia’katlefalkalii: L) + kscos"$) 
= Is: katlefılkali:L)+k,(R- V)"*) (5.11) 


10.08” & steht für (cos $)". 
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Abbildung 5.8: Skizzierung der in Richtung des Betrachters abgestrahlten Intensität für 
großes und kleines n. Die Intensitätsverteilung ist durch eine Kurve angedeutet. Die in 
eine Richtung abgegebene Intensität entspricht der Länge des Vektors zum Schnittpunkt 
zwischen dem Richtungsvektor und der Kurve. 


Dabei ist k, der spiegelnde Reflexionskoeflizient. k, liegt zwischen 0 und 1 und 
wird beim Phong-Modell experimentell festgelegt. Abbildung 5.8 veranschau- 
licht die Definition. 


Das gerade beschriebene Modell der spiegelnden Reflexion ist ein lokales Mo- 
dell, weil nur die Wechselwirkung der einzelnen Oberflächen mit den Lichtquel- 
len betrachtet wird. Von anderen Oberflächen auf die betrachtete Oberfläche 
spiegelnd reflektiertes Licht wird nicht berücksichtigt. Das Spiegelbild eines 
Objektes in einem anderen Objekt kann also nicht wiedergegeben werden. 


Eine alternative Formulierung der spiegelnden Reflexion im Phong-Modell 
erhält man durch Verwendung des Halbvektors 


H=-(L+4V), 


Dim 


vgl. [Bli77], der zwischen Z und V zeigt, vgl. Abbildung 5.9. Der Winkel zwi- 
schen 7 und H ist nach Konstruktion halb so groß wie der Winkel zwischen R 
und V. H kann als der Normalenvektor einer Oberfläche aufgefaßt werden, die 
so orientiert ist, daß V mit dem Reflexionsvektor zusammenfällt. Gesucht ist 
also die Orientierung einer Oberfläche, für die R und V zusammenfallen. Sei « 
der Winkel zwischen n und H. Wenn man die Oberfläche um Winkel «a neigt, 
wird der Winkel zwischen Z und X um «a größer. Da R mit dem Normalenvektor 
r den gleichen Winkel bilden muß, wird R dabei um 2a gedreht. Der Winkel 
zwischen R und V ist also zweimal so groß wie der Winkel zwischen x und H. 
Wenn man in Formel (5.11) n- H statt R-L verwendet, erhält man nicht die 
gleiche Intensität. Man kann dies durch Anpassen des Exponenten n von ü- H 
kompensieren. 
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Abbildung 5.9: Zur Definition des Vektors H. H ist der Normalenvektor einer um einen 
Winkel «& geneigten Oberfläche. 


Iges = In: ka + Ieinf fa (ksfä .L)+k,(R: Ay") (5.12) 


Der Vorteil dieser Formulierung liegt darin, daß R nicht mehr verwendet wird 
und deshalb auch nicht mehr berechnet werden muß.!! Die Berechnung des 
Vektors H ıst sehr einfach. Wenn man annimmt, daß die Lichtquelle und der 
Betrachter im Unendlichen liegen, sind die Vektoren Z und V, und damit auch 
H, für die gesamte Oberfläche konstant. 


5.3.4 Vereinfachungen des Phong-Modells 


Wir fassen hier noch einmal die Vereinfachungen und Annahmen des Phong- 
Modells zusammen: 


e Die verwendeten Lichtquellen sind im Unendlichen liegende Punkt- 
Lichtquellen, d.h. es wird keine Intensitätsverteilung in der Lichtquelle 
angenommen. 

e Die Betrachterposition liegt ebenfalls im Unendlichen. 

e Diffuse und spiegelnde Reflexion werden als lokale Terme behandelt. 

e Der Abfall der spiegelnden Intensität mit dem Winkel zwischen RundV 
wird empirisch nachgebildet. 

e Das Licht aus der Umgebung wird als Konstante behandelt. 


!1Dje Berechnung von R ist in Abschnitt 8.2.1 beschrieben. 
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Das Phong-Modell wird in der Praxis oft angewendet, weil es einfach zu berech- 
nen ist und für viele Anwendungen akzeptable Ergebnisse liefert. Die darge- 
stellten Objekte haben allerdings ein typisches Aussehen: da die Oberflächen- 
eigenschaften der einzelnen Objekte nicht nachgebildet werden, scheinen alle 
Objekte aus “Plastik” zu sein. Da keine Schatten berechnet werden, kann die 
genaue räumliche Postierung meist nicht erkannt werden, die Objekte scheinen 
“in der Luft zu fliegen”. Da mehrfache Reflexionen zwischen den einzelnen Ob- 
jekten nicht nachgebildet werden, wirkt die Beleuchtung immer sehr unnatürlich 
und es werden keine Spiegelbilder dargestellt. 


5.3.5 Berücksichtigung von Farbe 


In der bisherigen Beschreibung wurden nur monochromatisches Licht und mo- 
nochromatische Oberflächen berücksichtigt. Farbige Oberflächen und farbiges 
Licht werden dadurch berücksichtigt, daß für jede der drei Grundfarben rot, 
grün und blau ein separater Intensitätswert berechnet wird: 


Igesn = Ta kay + Ian fo ((kanlü: E) + kscos”$)) 
Igng = Tag  kag + les fe ((kas(ü: 2) + kıcos"4)) (5.13) 
I ges,b = Ta, ‘ ka, + le, fa (kasla ‘ 2) + k,cos”9)) 


Da das spiegelnd reflektierte Licht die Farbe des einfallenden Lichtes hat, wird 
nur ein spiegelnder Reflexionskoeffizient verwendet. Für das diffus reflektierte 
Licht werden hingegen für jede Grundfarbe eigene Reflexionskoeflizienten ver- 
wendet. I, bzw. I. ist z.B. die Intensität der roten indirekten Beleuchtung 
bzw. des roten einfallenden Lichtes. 


5.3.6 Ungleichmäßige Abstrahlung der Lichtquelle 


In der bisher beschriebenen Form nimmt das Phong-Modell an, daß die 
verwendeten Lichtquellen punktförmig sind und in alle Richtungen die glei- 
che Intensität abstrahlen. Durch einen einfachen Trick kann man auch 
eine ungleichmäßige Abstrahlung der Lichtquelle modellieren, vgl. [|War83], 
[FvDFH90]. Dazu stellt man eine Lichtquelle L als Punkt auf einer hypothe- 
tischen, spiegelnd reflektierenden Oberfläche dar, vgl. Abbildung 5.10. Diese 
Oberfläche wird von einer punktförmigen Lichtquelle L’ aus der Richtung L 
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Abbildung 5.10: Einführung einer hypothetischen Oberfläche zur Modellierung einer 
ungleichmäßigen Abstrahlung der Lichtquelle. 


beleuchtet. Wenn L' senkrecht auf der hypothetischen Oberfläche steht, ist 
das in Richtung L spiegelnd abgestrahlte Licht nach der in Abschnitt 5.3.3 
beschriebenen Berechnung bestimmt durch 


I, = I. fa cos? x 


Dabei ist I. die von der Punkt-Lichtquelle abgegebene Intensität. Es wird ein 
spiegelnder Reflexionskoeffizient von 1 für die hypothetische Oberfläche ange- 
nommen. 7 ist der Winkel zwischen E' und —Z. Wenn L’ und Z normiert sind, 
kann I, auch geschrieben werden als: 


Per) 


I, = 1. f(-L- LP 


Diese Gleichung beschreibt eine Lichtquelle, deren Intensitätsverteilung sym- 
metrisch zu L’ ist. In Richtung L' wird die meiste Intensität abgestrahlt. 
In andere Richtungen wird umso weniger Intensität abgestrahlt, je weiter die 
Richtung von L' abweicht. Je größer p ist, desto schneller ist der Abfall mit 
wachsendem 7, d.h. desto gerichteter ist die Lichtquelle. p = 0 liefert eine 
gleichmäßig abstrahlende Lichtquelle. Kleine Werte von p erzeugen ein eher 
diffuses Flutlicht, große Werte von p erzeugen ein stark gerichtetes Spotlicht. 
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5.4 Das Reflexionsmodell von Cook und Tor- 
rance 


Das Reflexionsmodell von Cook und Torrance stützt sich im Vergleich zum 
Reflexionsmodell von Phong mehr auf die physikalische Realität als auf empi- 
rische Werte. Ebenso wie das Phong-Modell unterteilt das Reflexionsmodell 
von Cook und Torrance das reflektierte Licht in drei Komponenten: eine diffus 
reflektierte, eine spiegelnd reflektierte Komponente und eine Umgebungslicht- 
Komponente. Der Unterschied liegt vor allem in der Berechnung der spiegelnd 
reflektierten Komponente, die nicht wie beim Phong-Modell durch einen em- 
pirischen Term cos” # nachgebildet wird. Statt dessen wird ein physikalisches 
Modell verwendet, das mit Hilfe des Fresnel-Gesetzes die Farbe des reflektier- 
ten Lichtes in Abhängigkeit von der Wellenlänge des einfallenden Lichtes, der 
Eigenschaften des reflektierenden Mediums und dem Einfallswinkel berechnet. 
Damit wird die vereinfachende Annahme des Phong-Modells aufgegeben, daß 
das spiegelnd reflektierte Licht immer die Farbe des einfallenden Lichtes hat. 
Auch die Annahme des Phong-Modells, daß die spiegelnd reflektierte Kompo- 
nente unabhängig vom Einfallswinkel immer gleich groß ist, wird aufgegeben. 
Statt dessen wird die in der Realität beobachtete Tatsache berücksichtigt, daß 
die spiegelnd reflektierte Komponente umso größer ist, je größer der Einfallswin- 
kel ist. Wenn man z.B. ein Schaufenster aus spitzen Winkel betrachtet, erscheint 
es sehr spiegelnd zu sein, bei senkrechten Blickwinkel ist kaum eine Spiegelung 
zu erkennen. Außerdem wird berücksichtigt, daß bei spiegelnder Reflexion mit 
kleinem Einfallswinkel das Maximum des spiegelnd reflektierten Lichtes nicht in 
Richtung des theoretisch errechneten Reflexionsvektors (Einfallswinkel = Aus- 
fallswinkel) liegt, sondern gegen diesen geringfügig verschoben ist. Insgesamt 
kann man sagen, daß die erzeugten Darstellungen realitätsnaher als die mit dem 
Phong-Modell erzeugten sind. Die Berechnung der Darstellungen ist aber auch 
rechenzeitaufwendiger. 


Die physikalischen Grundlagen des Modells wurden in [TS67] für polierte Metal- 
loberflächen beschrieben und sind in [Bli77] zum ersten Mal als Reflexionsmodell 
für die Computergraphik vorgeschlagen worden. In [CT82] wurde dieses Mo- 
dell so erweitert, daß auch Farbverläufe in Schlaglichtern dargestellt werden 
können. Wir werden im folgenden das Modell näher beschreiben, vgl. auch 
[CT82], [Wat89], [FvDFH90], [HTSG91] und [For93]. Dabei können wir aus 
Platzmangel leider nicht auf alle Details eingehen. Ausführlichere Informatio- 
nen zu den zugrundeliegenden physikalischen Mechanismen findet man z.B. in 


[Hal89], [IGMH88] und [SH81]. 
Die bidirektionale Reflektivität R ist definiert als das Verhältnis zwischen reflek- 
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tierter Strahlungsdichte B, und der aus Richtung L einfallenden Intensität D;: 


R=—Z (5.14) 


Für die reflektierte Strahlungsdichte B, gilt also wegen (5.9) 


D 
] 
ES 
> 
] 


RB;dN.cos 6 
RB;dN(ü-L) 


Man beachte, daß dies nur die Strahlungsdichte ist, die von dem aus Raumwinkel 
dN) einfallenden Licht herrührt. Die reflektierte Gesamt-Strahlungsdichte ergibt 
sich durch Integration über alle Raumwinkel. Vereinfachend kann man anneh- 
men, daß die bidirektionale Reflektivität R in eine spiegelnde und eine diffuse 
Komponente zerlegt werden kann. Die spiegelnde Komponente repräsentiert 
das von der Oberfläche des Objektes reflektierte Licht, die diffuse Komponente 
entsteht entweder durch Streueffekte innerhalb des Objektes oder durch mehrfa- 
che Reflexionen an der Oberfläche des Objektes, wie sie bei rauhen Materialien 
entstehen können. Die spiegelnde und die diffuse Komponente können unter- 


schiedliche Farbe haben. R ist damit: 
R=k,R,+ kaRa 


Dabei ist R, die spiegelnde, R, die diffuse bidirektionale Reflektivität. k, ist 
der spiegelnde, k; der diffuse Reflexionskoeffizient. Wir nehmen hier an, daß 
k, + kı = 1. Neben der direkten Beleuchtung durch Lichtquellen soll auch die 
durch mehrfache Reflexionen hervorgerufene indirekte Beleuchtung berücksich- 
tigt werden. Dazu führt man eine Umgebungs-Reflektivität ein, von der man 
der Einfachheit halber annimmt, daß sie von der Position des Betrachters un- 
abhängig ist. Ebenso nimmt man an, daß die Umgebungsbeleuchtung aus allen 
Richtungen gleichmäßig einfällt. Die in Richtung des Betrachters reflektierte 
indirekte Beleuchtung wird damit zu 


Bra — R.Biaf 


Dabei ist f der Verdeckungsfaktor, der angibt, welcher Teil der betrachteten 
Oberfläche nicht von anderen Objekten verdeckt ist. Wenn wir f = 1 anneh- 
men, ergibt sich für die reflektierte Strahlungsdichte bei Verwendung von n 
Lichtquellen Lı,-:-,L; mit einfallenden Strahlungsdichten B;ı,- ‚Bin: 
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B, = R.Bia + \(kR, + kaRs) Bad (RL) 


i=1 


Die diffuse Komponente und die Umgebungslicht-Komponente werden in alle 
Richtungen gleichmäßig reflektiert. R, und R, sind also unabhängig von der 
Betrachterposition und hängen nur von der Richtung des Lichteinfalls ab. Die 
spiegelnde Komponente reflektiert dagegen in bestimmte Richtungen mehr Licht 
als in andere, ist also von der Betrachterposition abhängig. Zur Bestimmung 
der spiegelnden Reflektivität wird angenommen, daß die betrachtete Oberfläche 
aus einer Ansammlung von ebenen, mikroskopisch kleinen Flächenstücken un- 
terschiedlicher Orientierung besteht, die perfekt spiegelnd sind, vgl. [TS67] und 
Abbildung 5.11. Nur die Flächenstücke, deren Normalenvektor in Richtung 
H zeigt, leisten einen Beitrag zur Reflexion von Richtung Z in Richtung V. 
Der Normalenvektor der Oberfläche ergibt sich aus dem Durchschnitt der Nor- 
malenvektoren der einzelnen Flächenstücke. Die Orientierung der einzelnen 
Flächenstücke wird durch eine Verteilungsfunktion festgelegt. Für die spie- 
gelnde Reflektivität wird in [CT82] 


F DE 


raDa-v) 


(5.15) 


verwendet. Dabei ist F der Fresnel-Term, der von der Richtung und der Wel- 
lenlänge des einfallenden Lichtes abhängig ist, und der beschreibt, wie das Licht 
von den einzelnen Flächenstücken reflektiert wird. Der Verdeckungsfaktor G 
beschreibt die Tatsache, daß die Flächenstücke der betrachteten Oberfläche 
sich gegenseitig verdecken können. Die Verteilungsfunktion D bestimmt die 
Verteilung der Orientierung der Flächenstücke um den Normalenvektor der 
Oberfläche. Der Term rn - L im Nenner sorgt dafür, daß die Reflektivität pro- 
portional ist zur effektiven Fläche, die von der Lichtquelle bestrahlt wird. Der 
Term nV sorgt dafür, daß die Reflektivität proportional ist zur effektiven 
Fläche, die vom Betrachter gesehen wird. Wir werden jetzt F, G und D näher 
beschreiben. 


In [TS67] wird als Verteilungsfunktion die Gauß’sche Normalverteilung verwen- 
det: 


D= ce? Im? 


Dabei ist & der Winkel zwischen H und ni, c ist eine geeignet zu wählende 
Konstante. m bestimmt die Standardabweichung der Orientierung der einzelnen 
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Flächenstücke vom Normalenvektor der Oberfläche, d.h. die Breite der Kurve 
und damit die Größe der Schlaglichter. Kleine Werte von m beschreiben eine 
spiegelähnliche Oberfläche. Für m — 0 wird eine perfekt spiegelnde Oberfläche 
beschrieben, für die nur dann ein Beitrag in Richtung V reflektiert wird, wenn H 
und rn zusammenfallen. Große Werte von m beschreiben matte Oberflächen. In 
[CT82] wird die Beckmann-Verteilung als Verteilungsfunktion vorgeschlagen. 
Diese hat gegenüber der Gauß-Verteilung den Vorteil, daß keine willkürliche 
Konstante verwendet wird, die Berechnung ist aber rechenzeitaufwendiger. Für 
rauhe Oberflächen lautet die Beckmann-Verteilung!? 


1 


- tan? «/m? 
Am? cos? a 


D(m) = 


Zur Modellierung von Oberflächen mit mehreren Stufen von Rauhheit wird in 
[CT82] eine gewichtete Summe von Verteilungsfunktionen verwendet: 


D= Y_ w; D(m;) 
j=l 


w; ist die Gewichtung der j-ten Verteilung. Die Summe der Gewichte ergibt 1. 


Der Verdeckungsfaktor G bestimmt, in welchem Ausmaß sich die Flächenstücke 
der betrachteten Oberfläche verdecken. G@ = 1 bedeutet, daß keine Verdeckung 
vorliegt, G@ = 0 bedeutet totale Verdeckung. G wird in [Bli77] aus drei un- 
terschiedlichen Situationen bestimmt, die durch die Lage von L und V de- 
finiert werden, vgl. Abbildung 5.11. Das einfallende Licht kann von einem 
Flächenstück der Oberfläche vollständig reflektiert werden, siehe 5.11(a). In 
diesem Fall findet keine Verdeckung statt, der Verdeckungsfaktor ist @, = 1. Es 
kann auch vorkommen, daß das einfallende Licht nur teilweise reflektiert wird, 
weil ein Teil des reflektierten Lichtes auf andere Flächenstücke der Oberfläche 
fällt, vgl. Abbildung 5.11(b). In diesem Fall kann G analytisch bestimmt wer- 
den, wenn man annimmt, daß die Flächenstücke V-förmige Gruben bilden, die 
symmetrisch um den Normalenvektor n der Oberfläche angeordnet sind, vgl. Ab- 
bildung 5.12. Wenn l ein Schnitt durch die Gesamtfläche des Flächenstücks ist 
und wenn m ein Schnitt durch die Fläche ist, deren reflektiertes Licht nicht von 
anderen Flächenstücken verdeckt wird, ist G, = m/l. m/l kann aus der Geo- 
metrie der Anordnung, wie sie in Abbildung 5.13 wiedergegeben ist, berechnet 
werden, vgl. [For93]. Die Anwendung des Sinussatzes auf das Dreieck ABC 
liefert 


_ 12]n [CT82] fehlt die 4 im Nenner, vgl. [Hal89]. 
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z_ sin(/2-+ 7) 
m sin ß 


Dabei ist d = r-a-#/2-Y. Die Anwendung des Sinussatzes auf das Dreieck 
AB'C liefert 

z _ sin(# — 2o) 

l  sina 


Das Dividieren dieser beiden Gleichungen liefert 


m _ sin( — 2) sin(r/2— a -—-Y) 


l sin « sin(7/2 +) 
Die Additionstheoreme für die trigonometrischen Funktionen liefern die Be- 
ziehungen sin(# — 2«) = 2sinacoso, sin(”/2 —- (@+Y)) = cos(@+y) und 


sin(r/2+Y) = cosy. Einsetzen liefert: 


m _ 2cosacos(@+Y) 
I cos Y 


Wenn ii, H und V normiert sind, gilt cosy= H-V, cosa = H-fund cos(a+7) = 
V.n. Also ist: 


In der Situation von Abbildung 5.11(c) sind die Rollen von Z und V vertauscht. 
Für G., ergibt sich: 


Der Nenner bleibt gleich, weil nach Festlegung von # gilt, daß (H-L)= (H-V). 
Für G wird das Minimum der drei Terme benutzt, d.h. es ergibt sich: 


= min{ 1,2 
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Abbildung 5.11: Lichtreflexion von einem mikroskopischen Flächenstück. (a) zeigt 
den Fall, daß das einfallende Licht vollständig reflektiert wird. (b) zeigt den Fall, daß 
das reflektierte Licht von einem anderen mikroskopischen Flächenstück teilweise verdeckt 
wird. (c) zeigt den Fall, daß ein mikroskopisches Flächenstück nur von einem Teil des 
einfallenden Lichtes getroffen wird. 
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1 
mul 
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Abbildung 5.12: Bestimung des Anteils des reflektierten Lichtes im Fall von Abbildung 
5.11(b). | 





Abbildung 5.13: Geometrie der Anordnung im Fall von Abbildung 5.11(b). 
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Abbildung 5.14: Die in der Fresnel-Gleichung verwendete Notation. 


Der Fresnel-Term F bestimmt, welcher Teil des einfallenden Lichtes reflek- 
tiert wird. F kann aus der Fresnel-Gleichung hergeleitet werden, die für eine 
perfekt ebene, spiegelnde Oberfläche beschreibt, welcher Teil des einfallenden 
Lichtes reflektiert oder transmittiert wird. Dieser Teil ist üblicherweise abhängig 
vom Brechungsindex n und dem Auslöschungsfaktor x des verwendeten Mate- 
rials, sowie vom Einfallswinkel des Lichtes. F ist wellenlängenabhängig, da 
sowohl n als auch «x abhängig von der Wellenlänge des einfallenden Lichtes sind. 
Die Fresnel-Gleichung für unpolarisiertes Licht, das von einer nichtleitenden 
Oberfläche reflektiert wird, lautet 


FO) 


1 er —_ 6.) + sin?(6; — ) 
2 \tan?(4;+0,) sin?(6; + 6,) 

1 sin?(6; — 6.) ( cos?(#; — ) 
2 sin?(6; + 6.) cos?(@; + 0.) 


Dabei ist 6; der Winkel zwischen H und L, d.h. «os6; = HL, vgl. Ab- 
bildung 5.14. 0, ist der Brechwinkel, für den nach dem Snell’schen Gesetz 
sin 6, = sin ;/nı2 gilt. Dabei ist n12(A) = n2(A)/mı(A) der relative Brechungs- 
index zwischen den beiden betrachteten Medien. Die Fresnel-Gleichung kann 
auch als 
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1-e’ (,, [+9 -1? 
ra tea) u 


geschrieben werden wobei c = cosd; = H-L und ? = 2,+c@-1l. F wird 
minimal, wenn 6; = 0 ist, d.h. wenn das Licht senkrecht einfällt. In diesem Fall 
isstc=1undg=nı2 und 


FO) = En (5.17) 


F wird maximal für 6; = m/2. In diesem Fall ist c= 0 und 
Fr/2 =1 


Wenn die Werte des Brechungsindex n12(X) für verschiedene Wellenlängen be- 
kannt sind, kann F direkt aus der Gleichung (5.16) berechnet werden. Wenn 
nı2 nicht bekannt ist, kann nı2 aus gemessenen oder tabellierten Werten von 
F(}) für 6; = 0 und verschiedene Wellenlängen berechnet werden. Aus (5.17) 
ergibt sich | 


_1+ VFo(}) 
m12(A) = 1_ JENS RO) (5.18) 


Die so bestimmten Werte für nı2 können dann in (5.16) zur Bestimmung von 
F(}) für beliebige Einfallwinkel 0; verwendet werden. Die Abhängigkeit von F 
von der Wellenlänge des einfallenden Lichtes und dem Einfallswinkel bewirkt, 
daß die Farbe des reflektierten Lichtes sich mit dem Einfallswinkel ändert. Für 
Einfallswinkel 0; = 0 hat das reflektierte Licht die Farbe der Oberfläche. Wenn 
der Einfallswinkel sich m /2 nähert, nähert sich die Farbe des reflektierten Lich- 
tes der Farbe des einfallenden Lichtes. Da Fy/2 = 1, hat für 6, = r/2 das 
reflektierte Licht die Farbe des einfallenden Lichtes. Zur exakten Berechnung 
der auftretenden Farbverschiebung muß F(}) für viele Wellenlängen berechnet 
werden. Diese rechenzeitaufwendige Berechnung kann durch Verwendung eines 
mittleren Brechungsindex nm vermieden werden. nm wird mit Gleichung (5.18) 
aus einem mittleren Fresnel-Term F,„, berechnet, der als Mittelwert über die 
für die Wellenlängen des sichtbaren Spektrums tabellierten Werte für 6; = 0 
errechnet wird. Das einfallende Licht wird in die drei Grundfarben rot, grün 
und blau zerlegt und für jede der Grundfarben wird unter Verwendung von 
F,g; durch Interpolation ein Fresnel-Term bestimmt. Sei Red, der Rotanteil 
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der Materialfarbe. Bei senkrechtem Lichteinfall ist Redg auch der Anteil des 
roten Lichtes an der reflektierten Lichtintensität. Sei Red, ja der Rotanteil der 
Farbe des einfallenden Lichtes. Bei waagerechtem Lichteinfall ist Red,,, der 
Anteil des roten Lichtes an der reflektierten Lichtintensität. Der Anteil des ro- 
ten Lichtes für andere Einfallswinkel wird durch lineare Interpolation zwischen 


Red, und Red,,z berechnet: 


Red, = Redo + (Redya - Red) "on mt = Fmo) 
m,n/2 F m,O 

Die blaue und grüne Komponente werden analog interpoliert. Red,, wird in 
(5.15) anstelle von F zur Berechnung der spiegelnden Reflektivität für rotes 
Licht verwendet. Nähere Details zur unterschiedlichen Behandlung von lei- 
tenden und nichtleitenden Materialien findet man z.B. in [Hal89]. Dort wer- 
den auch Quellprogramme zur Berechung der einzelnen Größen angegeben. In 
[CT82] wird das beschriebene Modell auf Metalle und Plastik angewendet. Bei 
plastikähnlichen Objekten hat das spiegelnd reflektierte Licht in etwa die Farbe 
des einfallenden Lichtes. Deshalb haben die dargestellten Objekte ın etwa das 
gleiche Aussehen wie bei der Verwendung des Phong-Modells. Für polierte 
metallische Objekte ist aber eine deutliche Farbverschiebung festzustellen, das 
spiegelnd reflektierte Licht hat teilweise die Farbe des Materials. 


Weiterentwicklungen des Reflexionsmodells von Cook und Torrance zur Einbe- 
ziehung anderer Materialien findet man in [Kaj85], [WK90] und [HTSG91]. In 
[Kaj85] wird das Modell auf Objekte erweitert, deren Reflexionseigenschaften 
nicht symmetrisch zum Normalenvektor der Oberfläche verteilt sind. In [WK90] 
wird die Tatsache berücksichtigt, daß der Polarisationszustand des Lichtes sich 
durch die Reflexion ändert. [HTSG91] erweitert das Modell auf den Bereich der 
physikalischen Optik, die das Wellenmodell des Lichtes zur Beschreibung der Re- 
flexion verwendet. Damit können auch Beugungseffekte und Interferenzeffekte 
beschrieben werden. 


Kapitel 6 


Schattierungsverfahren 


Bisher haben wir angenommen, daß die Objekte der darzustellenden Szene 
durch ebene Polygone beschrieben oder approximiert werden und daß jedem 
dieser Polygone ein einheitlicher Farbwert zugeordnet ist. Letzteres kann bei 
der Darstellung zu unrealistischen Effekten führen, wenn an den Übergängen 
zwischen zwei Polygonen desselben Objektes ein Farbsprung auftritt. Dies ist 
vor allem bei der Annäherung von gekrümmten Oberflächen mit ebenen Poly- 
gonen sehr störend. 


Eine kontinuierliche Farbverteilung erreicht man durch Anwendung eines der im 
letzen Kapitel beschriebenen Reflexionsmodelle: Für jeden sichtbaren Punkt 
jedes darzustellenden Objektes wird ein Normalenvektor berechnet, mit des- 
sen Hilfe ein Farbwert wie im letzten Kapitel beschrieben berechnet wird. 
Da dieses Verfahren aber sehr rechenzeitaufwendig ist, sind weniger aufwen- 
dige Schattierungsverfahren entwickelt worden, die in diesem Kapitel behandelt 
werden sollen. Wir werden zwei dieser Verfahren vorstellen: die Gouraud- 
Schattierungstechnik und die Phong-Schattierungstechnik. Beide Techniken 
setzen voraus, daß die Objekte der darzustellenden Szene durch ebene Poly- 
gone beschrieben werden. Beide Techniken sind Interpolationsverfahren: Die 
Gouraud-Methode interpoliert Farbwerte, die Phong-Methode interpoliert Nor- 
malenvektoren, die zur Berechnung von Farbwerten verwendet werden. 


6.1 Gouraud-Schattierung 


Die Gouraud-Schattierungstechnik, vgl. [Gou71], [Wat89], [BG89], [FvDFH90] 
kommt mit relativ wenig Rechenaufwand aus. Sie ist besonders geeignet zur 
Darstellung von Objekten, bei denen die diffuse Reflexion überwiegt. Jedes der 
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Abbildung 6.1: Berechnung des Normalenvektors für einen Polygonknoten V. Der 
Normalenvektor von D bleibt unberücksichtigt. 


darzustellenden Objekte sei durch eine Menge von ebenen, konvexen Polygonen 
beschrieben. Die ein Objekt beschreibenden Polygone haben evtl. gemeinsame 
Kanten und gemeinsame Knoten. Die Gouraud-Methode berechnet für jeden 
Knoten eines Polygons einen Farbwert.! In einem zweistufigen Interpolations- 
prozeß werden zuerst Farbwerte für die Kanten der Polygone und danach für 
innere Punkte der Polygone berechnet. Zur Berechnung des Farbwertes ei- 
nes Polygonknotens wird eines der Reflexionsmodelle aus dem vorangehenden 
Kapitel verwendet. Jedes dieser Reflexionsmodelle braucht einen Normalen- 
vektor zur Berechnung des Farbwertes. Wenn das betrachtete Polygon zur 
Beschreibung einer ebenen Oberfläche verwendet wird, wird für jeden Kno- 
ten des Polygons der Normalenvektor der Oberfläche verwendet. Wenn das 
betrachtete Polygon zur Beschreibung einer gekrümmten Oberfläche verwendet 
wird, wird der Normalenvektor für einen Knoten des Polygons als Mittelwert 
der Normalenvektoren der angrenzenden Polygone berechnet. Dabei sollen aber 
nur die angrenzenden Polygone berücksichtigt werden, die zur Modellierung der 
gleichen (gekrümmten) Oberfläche wie das betrachtete Polygon verwendet wer- 
den. Als Beispiel betrachten wir einen Zylinder, dessen Mantelfläche durch 
Polygone approximiert ist, vgl. Abbildung 6.1. Seien P,, P und P3 drei dieser 
Polygone, die benachbart sind. Die Deckfläche sei durch Polygon D dargestellt. 
V sei der Knotenpunkt, an dem sich Pı, Pa, Ps und D treffen. Der Normalen- 
vektor ü(V) von V wird durch Mittelung über die Normalenvektoren von P,, 
P, und P3 berechnet. Der Normalenvektor von D bleibt unberücksichtigt, weil 


n(V) als Approximation von Normalenvektoren auf der Mantelfläche verwendet 


!Ein Farbwert besteht aus drei Intensitätswerten /,, I;, I, für die drei Grundfarben rot, 
grün und blau. Wir werden hier Farbwerte mit dem Buchstaben I bezeichnen. 
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Abbildung 6.2: Darstellung eines Polygons mit der Gouraud-Schattierungstechnik. 


werden soll. 


Nachdem zu jedem Polygonknoten V ein Normalenvektor ü(V) bestimmt ist, 
kann mit Hilfe eines geeigneten Reflexionsmodells aus dem letzten Kapitel auch 
der Farbwert I(V) in Punkt V bestimmt werden. Nach Bestimmung von I(V) 
werden in einem ersten Schritt durch lineare Interpolation Farbwerte für die 
Punkte auf den Polygonkanten bestimmt. In einem zweiten Schritt wird dann 
für jeden inneren Polygonpunkt mit Hilfe eines Scangeraden-Algorithmus eben- 
falls durch lineare Interpolation ein Farbwert bestimmt. Beide Schritte werden 
in der Projektionsebene durchgeführt. 


Sei P das darzustellende Polygon. Die Projektion P’ von P erstrecke sich 
in der Projektionsebene zwischen den y-Werten Yymin(P) und Ymaz(P). Zur 
Darstellung von P mit der Gouraud-Methode wird zu jedem Knoten V von 
P wie beschrieben ein Normalenvektor ü(V)) bestimmt, mit dessen Hilfe durch 
Anwendung eines Reflexionsmodells ein Farbwert I(V) berechnet wird. Dann 
schiebt man eine Scangerade von Ymin(P) bis Ymaz(P) über P’ und berechnet 
mit einem inkrementellen Verfahren (Bresenham-Algorithmus, vgl. Abschnitt 
2.1.2) die beiden Schnittpunkte P, und P, der Scangeraden mit den Kanten von 
P'. Sei y= y, die aktuelle Scangerade. Die Scangerade schneide die Projektion 
eı und e, zweier Polygonkanten von P. e, und ey erstrecken sich zwischen den 
Punkten P, = (zı,yı) und P} = (z2,y2) bzw. P3 = (23,y3) und P4 = (24, Ya), 
vgl. Abbildung 6.2. Die für P; errechneten Farbwerte seien I;, 1 <ı <4. Der 
Schnittpunkt mit eı sei P, = (z.,Y.), der Schnittpunkt mit ez sei P, = (23,9). 
P, = (z,,y,) sei ein innerhalb von P’ liegender Punkt auf der Scangeraden. Die 
Farbwerte I, von P, und I, von P; werden aus Iı und Is bzw. Iz und I durch 
lineare Interpolation bzgl. der y-Werte berechnet: 
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Abbildung 6.3: Darstellung ei- 
ner gewellten Oberfläche mit der 
Gouraud-Methode: Bei ungünstiger 
Aufteilung in ebene Polygone gleichen 
sich die Normalenvektoren benachbar- 
ter Polygone aus und für die Polygon- 
knoten werden gleiche Normalenvek- 
toren berechnet. Daher wird die ge- 
wellte Oberfläche eben dargestellt. 





„= 1.2241. 2 (6.1) 
Yı — Ya Yyı — Ya 

heiss 4 2 (6.2) 
Yy3 — Ya Y3 — Ya 


Aus I, und I, wird der Farbwert I, von P, durch lineare Interpolation bzgl. der 
z-Werte berechnet: 


Ip — Is Ls — Ta 


+ 


IL) — La Ip — Ta 


(6.3) 





Die Berechnung von I, läßt sich durch ein inkrementelles Verfahren vereinfachen: 
Wenn Ar der Abstand zweier benachbarter Pixel ist, ist der Unterschied der 
Farbwerte dieser Pixel 


Al, = -L- 








(bh - A) (6.4) 





Der Farbwert des n-ten Pixels I, auf der aktuellen Scangerade y = y, errechnet 
sich aus dem Farbwert I,n-ı des (n — 1)-ten Pixels durch 


In = Iun-ı +AL, (6.5) 
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Bei der Darstellung von leicht gewellten Oberflächen können bei Verwendung 
der Gouraud-Methode Darstellungsfehler auftreten, wenn die Unterteilung in 
ebene Polygone zu grob gewählt ist, vgl. Abbildung 6.3. In diesem Fall kann die 
Mittelung über die Normalenvektoren der angrenzenden Polygone einen Aus- 
gleich bewirken, der dazu führt, daß die eigentlich gewellte Oberfläche als ebene 
Oberfläche dargestellt wird. Man kann diese Darstellungsfehler durch eine fei- 
nere Unterteilung in Polygone beheben. Der größte Nachteil der Gouraud- 
Methode besteht darin, daß ein ganz innerhalb eines Polygons liegendes, durch 
spiegelnde Reflexion entstehendes Schlaglicht nicht dargestellt wird, wenn kein 
Knoten des Polygons überdeckt wird. Der Grund dafür liegt darin, daß die 
Farbwerte für innere Punkte nur durch Interpolation der Farbwerte der Kno- 
ten des Polygons errechnet werden. Eine Abhilfe schafft ebenfalls eine feinere 
Unterteilung der darzustellenden Oberfläche. Wegen dieses Nachteils ist die 
Gouraud-Methode vor allem zur Darstellung von Objekten geeignet, bei de- 
nen die diffuse Reflexion überwiegt, die also, wenn überhaupt, ausgedehnte 
Schlaglichter aufweisen, die sich über mehrere Polygone erstrecken. 


6.2 Phong-Schattierung 


Bei der im letzten Abschnitt beschriebenen Gouraud-Interpolation werden 
Farbwerte interpoliert: Für jeden Knoten des darzustellenden Polygons P wird 
ein Farbwert bestimmt, aus dem durch Interpolation Farbwerte für die inneren 
Punkte von P berechnet werden. Bei der Phong-Interpolation, vgl. [Pho75], 
[Wat89], [FvDFH90], [BG89], werden dagegen die zur Berechnung der Farbwerte 
benötigten Normalenvektoren interpoliert: Wie bei der Gouraud-Interpolation 
wird für jeden Knoten des Polygons durch Mittelung ein Normalenvektor be- 
rechnet. Mit Hilfe der Normalenvektoren für die Polygonknoten werden in 
einem ersten Schritt durch lineare Interpolation Normalenvektoren auf den 
Polygonkanten berechnet. Aus diesen werden in einem zweiten Schritt wie- 
der durch lineare Interpolation Normalenvektoren für die inneren Punkte des 
Polygons bestimmt. Auch hier wird wieder ein in der Projektionsebene arbeiten- 
der Scangeraden-Algorithmus angewendet. Für jedes von dem darzustellenden 
Polygon überdeckte Pixel? des Bildschirms wird also ein Normalenvektor berech- 
net, der eine Approximation des wirklichen Normalenvektors der (gekrümmten) 
Oberfläche ist, die durch ebene Polygone angenähert wird. Der für ein Pixel 
berechnete Normalenvektor wird für die Berechnung des Farbwertes des Pixels 
verwendet. 


2Im folgenden werden wir in diesem Zusammenhang einfach von den Pixeln eines Polygons 
reden und meinen damit die Pixel, die von der Projektion des Polygons überdeckt werden. 
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F4 


Abbildung 6.4: Darstellung eines Polygons mit der Phong-Schattierungstechnik. 


Sei P das darzustellende Polygon und P’ dessen Projektion auf die Projektions- 
ebene. Sei y = y, die aktuelle Scangerade. Die Scangerade schneide die Projek- 
tion eı und ea zweier Polygonkanten von P zwischen den Punkten Pı = (z1,%ı) 
und A = (22,Y2) bzw. P, = (23,y3) und Pı = (24,44), siehe Abbildung 6.4. n; 
sei der für Punkt P; durch Mittelung errechnete Normalenvektor, 1 <ı< 4. 
Der Schnittpunkt der Scangerade mit eı sei P, = (2.,Ya), der Schnittpunkt 
der Scangerade mit ez sei R = (23, Ys). Sei P, = (z,,ys) ein innerhalb von 
P' liegender Punkt auf der Scangerade. Die Normalenvektoren rn, und n, für 
die Punkte P, und P, werden durch lineare Interpolation bzgl. der y-Werte 
berechnet: 


eh Rn Ir (6.6) 
yı "% Yyı = Y%2 

en irn FE (6.7) 
Yy3 — Ya Yy3 — Y4 


Aus fi, und fi, wird der Normalenvektor fi, von P, durch lineare Interpolation 
bzgl. der z-Werte berechnet: 


hen en Lp — Is En) Ls — Ta 
Ns = Na nr 


6. 
Ih — La j Th — Ta ( 8) 








Man beachte, daß (6.8) eine Vektorgleichung ist, die aus drei Komponenten 
besteht. Die Berechnung des Normalenvektors für P, mit (6.8) dauert also 
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dreimal länger als die Berechnung des Farbwertes für P, mit (6.3) bei der 
Gouraud-Methode. Außerdem muß bei der Phong-Methode nach der Berech- 
nung des Normalenvektors r, zu P, noch mit Hilfe eines Reflexionsmodells der 
zugehörige Farbwert berechnet werden. 


Auch hier läßt sich die Berechnung von rn, durch ein inkrementelles Verfah- 
ren vereinfachen: Wenn Ar der Abstand zweier benachbarter Pixel ist, ist der 
Differenz-Normalenvektor zweier benachbarter Pixel 











_ _ Ar _ Ar 
An, = Na‘ +n° 
Ih — Ta Ih = La 
Ar _ 
= (Mr — Na) 
Ih — La 


Der Normalenvektor des n-ten Pixels n,.„ auf der aktuellen Scangerade y = y, 
errechnet sich aus dem Normalenvektor n,n-ı des (n — 1)-ten Pixels durch 


don = Nsn-ı + An, (6.9) 


Die Gouraud-Methode ist gut geeignet zur Darstellung von Objekten, für die 
die diffuse Reflexion überwiegt. Bei der Darstellung von spiegelnder Reflexion 
kann die Gouraud-Methode versagen, weil im Innern eines Polygons liegende 
Schlaglichter, die keine der Knoten überdecken, nicht erkannt werden. Die 
Phong-Methode stellt dagegen auch diese Schlaglichter richtig dar, weil für 
jeden Punkt des Polygons ein Normalenvektor berechnet wird, der dem Nor- 
malenvektor der Original-Oberfläche üblicherweise recht nahe kommt. Deshalb 
ist der berechnete Farbwert recht genau, Schlaglichter werden auch innerhalb 
von Polygonen erfaßt. Allerdings erfordert die Phong-Methode gegenüber der 
Gouraud-Methode einen erheblich größeren Rechenaufwand. Eine Reduzierung 
des Rechenaufwandes der Phong-Methode wird im nächsten Abschitt behan- 
delt. 


6.3 Beschleunigung der Phong-Interpolation 


Bei der Phong-Interpolation wird für jedes Pixel des darzustellenden Polyons 
ein Normalenvektor berechnet, mit dessen Hilfe der darzustellende Farbwert 
bestimmt wird. Da dies eine recht aufwendige Berechnung erfordert, vgl. Ab- 
schnitt 6.2, versucht man die Phong-Interpolation zu beschleunigen. Dabei 
kann man prinzipiell zwei Arten von Ansätzen unterscheiden, vgl. [Wat89]: 
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Die numerischen Ansätze versuchen, die bei der Phong-Interpolation durch- 
geführten Berechnungen zu vereinfachen. In [BW86] wird ein Verfahren be- 
schrieben, das die Berechnung der Farbwerte bei Verwendung des Phong- 
Reflexionsmodells aus dem letzten Kapitel durch Verwendung einer zweidi- 
mensionalen Taylor-Reihe vereinfacht. Die geometrischen Ansätze versuchen 
aus der Geometrie der darzustellenden Szene zu bestimmen, ob ein Polygon ein 
Schlaglicht enthalten kann oder nicht. Wenn dies nicht der Fall ist, kann das 
Polygon mit der billigeren Gouraud-Methode dargestellt werden. Wir werden 
im folgenden ein geometrisches Verfahren vorstellen, vgl. [HMW88], [Wat89], 
das das in [BFS86] beschriebene Verfahren erweitert. 


Zuerst sei aber noch auf eine sehr einfache Methode zur Reduzierung der Lauf- 
zeit der Phong-Interpolation hingewiesen, dıe darin besteht, daß nur für jedes 
zweite Pixel ein Normalenvektor und ein Farbwert berechnet wird. Für die 
dazwischenliegenden Pixel wird der Farbwert durch einfaches Mitteln der Farb- 
werte der benachbarten Pixel errechnet. Dieses Vorgehen liefert ein Verfahren 
mit etwa 35% geringerer Laufzeit für die Schattierungsphase, ohne daß ein merk- 
licher Verlust in der Bildqualität auftritt. 


Eine größere Verringerung der Laufzeit erreicht man durch Anwendung des H- 
Tests (für highlight test), vgl. [HMW88], [Wat89]. Der H-Test beruht auf der 
Beobachtung, daß im Normalfall nur wenige Polygone der darzustellenden Szene 
ein Schlaglicht aufweisen. Die Idee des H-Tests besteht darin, diese Polygone 
zu erkennen und sie mit der Phong-Interpolation darzustellen. Alle anderen 
Polygone werden mit Gouraud-Interpolation dargestellt.” Der Aufwand für 
die Bestimmung der Polygone mit Schlaglicht lohnt sich, weil damit für die 
meisten Polygone ein Schlaglicht ausgeschlossen werden kann, die Laufzeit der 
Schattierungsphase wird erheblich reduziert, vgl. Tabelle 6.1. Wir werden im 
folgenden beschreiben, wie die Polygone mit Schlaglicht erkannt werden. Dabei 
nehmen wir an, daß das Phong-Reflexionsmodell, vgl. Abschnitt 5.3, für die 


Berechnung der Farbwerte verwendet wird. 


Der H-Test nimmt an, daß ein Schlaglicht dann vorliegt, wenn der Term für 
die spiegelnde Reflexion in Gleichung (5.12) einen relativ zum Gesamtwert der 
Intensität großen Wert hat. Beim Phong-Reflexionsmodell wird die spiegelnde 
Reflexion durch den Term 


3In der Praxis geht man etwas anders vor: Man benutzt die Gouraud-Methode, um für alle 
Polygone eine diffuse Komponente zu bestimmen. Für die vom H-Test bestimmten Polygone 
berechnet man zusätzlich eine spiegelnde Komponente, die zur der diffusen Komponente für 
die Darstellung hinzuaddiert wird. Der Grund für dieses Vorgehen liegt darin, daß die von der 
Gouraud-Methode und der Phong-Methode bestimmten diffusen Terme leicht voneinander 
abweichen, so daß sie nicht gut miteinander dargestellt werden können. 
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(1) (2) 8) 


Abbildung 6.5: Mögliche Lagen von Schlaglichtern auf einem Polygon. 


Tue — Feinf Fe k,(n 2 H)" 


beschrieben. Ein Schlaglicht liegt dann vor, wenn 


n-H>T (6.10) 


ist. T ist ein konstanter Schwellenwert, % und H seien normalisiert. Ob (6.10) 
erfüllt ist, wird mit fünf hierarchisch angeordneten Tests überprüft, die sich aus 
der möglichen Lage der Schlaglichter ergeben, vgl. Abbildung 6.5*: 


1. Ein Schlaglicht kann einen oder mehrere Knoten des Polygons überdecken. 


2. Ein Schlaglicht kann einen Teil einer Kante des Polygons überdecken, ohne 
einen Knoten zu überdecken. 


3. Ein Schlaglicht kann vollständig innerhalb des Polygons liegen, ohne eine 
Kante oder einen Knoten zu überdecken. 


Die Hierarchie der durchgeführten Tests ist in Abbildung 6.6 wiedergegeben. 
Test A bestimmt, ob für irgendeinen Knoten des Polygons z-H >T. gilt. 


“Man beachte, daß diese Fälle nur auftreten, weil für die Polygonknoten gemittelte Nor- 
malenvektoren berechnet und entlang der Kanten Normalenvektor interpoliert werden. Wenn 
man mit den Normalenvektoren der Ebenen rechnet, in denen die Polygone liegen, kann nur 
das gesamte Polygon von einem Schlaglicht bedeckt sein, nicht einzelne Teile des Polygons. 
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gilt für irgendeinen Knoten des 
Test A: Polygons rn: -H>T? —"—- Fall (1) 


| nein 


gilt für irgendeinen Punkt irgend- 
einer Kante des Polygons nr - H > 
T? 








Test B,C,D: Fall (2) 





Ja 





| nein 


erreicht % : H für jede Kante des Fall (3 
Test E: Polygons ein Maximum? Ja all (8) 





| nein 
kein Schlaglicht 


Abbildung 6.6: Hierarchischer Aufbau des H-Tests. 


Wenn ja, liegt Fall (1) von Abbildung 6.5 vor und die restlichen Tests brauchen 
nicht mehr durchlaufen zu werden. Die Tests B,C,D, die in dieser Reihenfolge 
angewendet werden, bestimmen, ob es ein Schlaglicht auf einer Polygonkante 
gibt. Test E bestimmt, ob es ein Schlaglicht gibt, das ganz im Inneren eines 
Polygons liegt. Wir werden im folgenden diese Test näher untersuchen. 


Test A überprüft, ob für einen Knoten V des betrachteten Polygons n(V)- 
ÄH>T gilt. Wenn dies der Fall ist, wird der Knoten von einem Schlaglicht 
überdeckt. Da die Gouraud-Methode Schlaglichter darstellen kann, wenn sie 
Polygonknoten überdecken, kann das betrachtete Polygon mit der Gouraud- 
Methode dargestellt werden. 


Test B wird durchgeführt, wenn für keinen Knoten des betrachteten Polygons P 
der Schwellenwert T überschritten wird. In diesem Fall soll festgestellt werden, 
ob auf einer Kante von P ein Schlaglicht liegen kann. Sei e eine nicht horizontale 
Kante von P, die sich zwischen den Punkten P, = (zı,yı) und P = (z3,%) 
mit ya < yı erstreckt. Sei n; der für Punkt P; durch Mittelung errechnete 
(und normalisierte) Normalenvektor (i = 1,2). Sei P, = (z,y) ein beliebiger 
auf e liegender Punkt. Der Normalenvektor für Punkt P, ergibt sich nach der 
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Phong-Interpolation zu: 


y»<y<Syı (6.11) 
Zur Vereinfachung der Rechnung wendet man auf das darzustellende Polygon 
zwei lineare Transformationen an, die die Richtung von fi(y) nicht beeinflussen: 


(1) Der Punkt P, wird in den Ursprung verschoben, d.h. man führt eine Trans- 
lation um (—-z2,—y2) durch. 
(2) Man skaliert in y-Richtung um den Faktor 1/(yı - ya). 


Durch Anwendung dieser linearen Transformationen erhält man aus Pı und 
P, die Punkte P} = (zi,yj) und Ri = (,y%) mityy = O0 undyi = 1. Zur 
Vereinfachung lassen wir ’ ab jetzt weg. Gleichung (6.11) wird dann zu: 


H sei ebenfalls normalisiert. Sei weiter 





Auf der Kante e liegt ein durch spiegelnde Reflexion hervorgerufenes Schlaglicht, 
wenn d(y) > T für einen Wert y zwischen 0 und 1 ist. Da Test B nur ausgeführt 
wird, wenn Test A nicht erfüllt ist, gilt 


0) = Pu) <T 


Wenn d(y) > T für einymitO0 < y< 1 gelten soll, muß die Funktion $ zwischen 
den beiden Endpunkten von e ein Maximum annehmen. Durch Einsetzen von 


6.12 erhält man für d(y): 


ya. H+(1-y)a-H 


MT Een ze Ten 


(6.13) 


Mita=nı: H, b=n: Hundc= fü - No ergibt sich daraus 


ya+(1-y)b 


u) = 2y2(1—-c)—-2y(l-c)+1 
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Die Ableitung nach y ist: 


Hy) = (a-b)(2y?(1-c)-2y(l-c)+1)- (2yll-c)-(1-ce))(b+y(a-b)) 
2y2(1-0)-1-c)+1)” 


d'(y) = 0 ist eine notwendige Bedingung für ein Maximum. Dies gilt, wenn 


_ be-a 
yaT-brbctac 


Mit d=bc-aunde=ac- berhält man als mögliche Maximumsposition: 


od 
YTdte 


Je nach Wert von d und e sind vier Fälle zu unterscheiden: 


(1) d=0O und e = 0: In diesem Fall ist ü, = nz. Die Interpolation (6.11) 
berechnet also ü(y) = fı für alle Werte von y zwischen 0 und 1. Damit ist 
auch #(y) konstant und es tritt kein Maximum entlang der betrachteten 
Kante auf. 

(2) d-e=0: Wennd=(,e#0, ity=0. Wennd#0l,e=I,isty=1. 
In beiden Fällen läge das Maximum also auf einem der Endpunkte der 
Kante. Dies ist aber nicht möglich, weil Test A nicht erfüllt war. 

(3) d-e< 0, d.h. d und e haben unterschiedliche Vorzeichen. In diesem Fall 
ist y< 0 oder y> 1, d.h. das Maximum liegt nicht auf der betrachteten 
Kante. 

(4) d-e > 0, d.h. d und e haben gleiche Vorzeichen. In diesem Fall ist 
0<y<1,d.h. das Maximum liegt auf der Kante. 


Damit kann nur für 


d-e>0 (6.14) 


ein Maximum auf der betrachteten Kante auftreten. Ob an der möglichen 
Maximumsposition Ymarz = d/(d + e) der Schwellenwert T' überschritten wird, 
wird mit den Tests C und D festgestellt. Die Aufteilung in zwei Tests wird 
vorgenommen, um die Rechenzeit möglichst gering zu halten. Test C überprüft, 
ob d(ymaz) > 0 ist. Dies ist dann der Fall, wenn 


AYmaz + (1 — Ymaz)b > 0 
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Durch Einsetzen von Ymaz erhält man daraus 


be+.ad 


dre >0 





Diese Ungleichung ist dann erfüllt, wenn Zähler und Nenner gleiches Vorzeichen 
haben. Wegen Bedingung (6.14) kann es nur dann ein Maximum auf der Kante 
geben, wenn d und e gleiches Vorzeichen haben. Deshalb reicht hier der Test 
auf gleiches Vorzeichen von d und be+ ad aus: 


(be+ad)d>0 (6.15) 


Wenn diese Ungleichung nicht erfüllt ist, kann der Schwellenwert T' an der Stelle 
Ymaz nicht überschritten werden. Wenn die Ungleichung erfüllt ist, wird Test D 
ausgeführt, um zu überprüfen, ob d(ymaz) > T ist. Man beachte, daß man für 
diese Überprüfung im Gegensatz zu Test C den Nenner von (6.13) ausrechnen 
muß. d(Ymaz) ist genau dann größer T', wenn 


AYymaz + (1 - Ymaz)b > TV 2YyZan(l - ©) - 2y4mas(l-e)+1 


Aus Test C ist bekannt, daß aymaz + (l — Ymaz)b > 0 ist. Ebenso ist T > 0. 
Deshalb erhält man als äquivalente Gleichung: 


(Aymaz + (1 - Ymaz)b)" > T’(2yman(l -c) - 2ymaz(l — c)+ 1) 
Einsetzen von Ymaz und Umformen liefert daraus die Ungleichung 


(be+ ad)? > „d+e? + 2cde 
(d+e)? (d+e)? 


Wegen (d+ e)? > 0 ist dies gleichbedeutend mit 


(be+ ad)? > T?(d? + e’ + 2cde) (6.16) 


Wenn (6.16) erfüllt ist, wird für einen Punkt auf der betrachteten Kante der 
Schwellenwert T überschritten. Es liegt also ein Schlaglicht auf der Kante und 
das betrachtete Polygon sollte mit der Phong-Interpolation dargestellt werden. 


Wenn Test D nicht erfüllt ist, gibt es nur noch die Möglichkeit, daß ein Schlag- 
licht ganz innerhalb des Polygons liegt. Dieser Fall kann dann auftreten, wenn 
die zur Definition der Objekte verwendeten Polygone recht groß sind und wenn 
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> 7 Abbildung 6.7: Schlaglicht im Inne- 


ren eines Polygons. 
A 


die darzustellenden Objekte stark spiegelnd sind. In diesem Fall sind die auf- 
tretenden Schlaglichter typischerweise recht klein. Ob ein Schlaglicht innerhalb 
des Polygons liegt wird mit Hilfe von Test E überprüft, der nur ausgeführt wird, 
wenn die Tests A bis D nicht erfüllt sind. Test E stützt sich auf die Beobach- 
tung, daß im Inneren eines Polygons P nur dann ein Schlaglicht liegen kann, 
wenn d(y) auf jeder Kante von P ein Maximum erreicht. 


Man kann diese Beobachtung anhand Abbildung 6.7 plausibel machen. Wir be- 
trachten Kante AB. Wenn d(y) auf der Kante AB kein Maximum hat, ist der 
interpolierte Normalenvektor auf der gesamten Kante AB konstant. Dies kann 
nur dann der Fall sein, wenn in den Punkten A und B gleiche Normalenvekto- 
ren vorliegen. Wenn auf der Kante BC ebenfalls konstante Normalenvektoren 
vorliegen, werden für beide Kanten gleiche Normalenvektoren berechnet, weil 
die beiden Kanten sich in B treffen. Die durch Interpolation berechneten Nor- 
malenvektoren im Polygoninnern haben dann ebenfalls diesen Wert und es kann 
kein Schlaglicht im Innern des Polygons liegen, wenn nicht schon auf den Kan- 
ten ein Schlaglicht liegt. Wir betrachten jetzt den Fall, daß auf der Kante BC 
die Normalenvektoren nicht konstant sind. Sei n, der Normalenvektor ın Punkt 
B, fü. der Normalenvektor in Punkt ©. Auf der Kante BC wird zwischen fi, 
und fi. interpoliert. Der Normalenvektor fi. im Punkt E liegt also zwischen fi; 
und fi.. Im Punkt D liegt Normalenvektor fi, vor. Zwischen D und E wird 
zwischen den Normalenvektoren ni, und n. interpoliert, also zwischen den glei- 
chen Normalenvektoren wie zwischen B und E. Wenn zwischen D und E ein 
Schlaglicht liegt, dann liegt auch zwischen B und E eines, d.h. auf der Kante 
BC. In diesem Fall wäre aber Test E gar nicht durchgeführt worden. Damit 
kann im Inneren des Polygons nur dann ein Schlaglicht liegen, wenn auf der 
Kante AB ein Maximum auftritt. Die gleiche Argumentation läßt sich auf die 
anderen Kanten anwenden. 


Test E überprüft, ob die Funktion d(y) auf jeder Kante des Polygons ein Ma- 
ximum erreicht. Wenn dies der Fall ist, wird ein Maximum ım Innern des 
Polygons angenommen und das Polygon wird mit Phong-Interpolation darge- 
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450 | 500 
223 | 393 


Anzahl der Polygone || 200 
sichtbare Polygone 


Polyone mit Schlaglicht 


Schattierungsmethode | | | | 


keine 









Gouraud 
Phong 
H-Test 





Tabelle 6.1: relativer Zeitvergleich zum H-Test aus [Wat89]. Der Eintrag keine gibt die 
Zeit für alle anderen Operationen außer der Schattierungsoperation an. 


stellt. Ansonsten wird die Gouraud-Interpolation verwendet. 


Tabelle 6.1 zeigt einen Zeitvergleich zwischen Gouraud-Interpolation, Phong- 
Interpolation und Phong-Interpolation mit H-Test. Man sieht, daß die 
Phong-Interpolation zwischen zwei- und dreimal so lange wie die Gouraud- 
Interpolation braucht. Durch Anwendung des H-Tests kann die Laufzeit der 
Phong-Interpolation aber so weit reduziert werden, daß nur noch zwischen 30 
und 50% mehr Rechenzeit als für die Gouraud-Interpolation benötigt wird. 


Kapitel 7 
Gekrümmte Oberflächen 


Bisher haben wir angenommen, daß gekrümmte Oberflächen durch Zerlegung 
in viele kleine Teil-Oberflächen modelliert werden, die dann durch ebene 
Flächenstücke angenähert werden. Dies hat den Nachteil, daß in Bereichen 
starker Krümmung je nach Größe der Flächenstücke Diskontinuitäten wahrge- 
nommen werden können und daß für jede gekrümmte Oberfläche eine große 
Anzahl von Flächenstücken abgespeichert werden muß. Um dies zu vermeiden, 
verwendet man mathematische Beschreibungen von gekrümmten Oberflächen. 
Das genaue Aussehen der Oberflächen wird - neben der Berechnungsvorschrift 
- von einer Anzahl von Kontrollpunkten gesteuert. Für eine darzustellende 
gekrümmte Oberfläche müssen nur die Koordinatenwerte dieser Kontrollpunkte 
abgespeichert werden!. Durch geeignete Wahl der Kontrollpunkte kann man 
die mathematisch beschriebene Oberfläche beliebig nahe an eine gegebene reale 


Oberfläche angleichen. 


In diesem Kapitel werden wir verschiedene mathematische Beschreibungen für 
gekrümmte Oberflächen vorstellen und deren Vor- und Nachteile diskutieren. 
Bezüglich der Behandlung der Kontrollpunkte unterscheidet man grundsätz- 
lich zwei Klassen von Verfahren zur Darstellung von gekrümmten Oberflächen: 
interpolierende und approzimierende Verfahren. Bei den interpolierenden Ver- 
fahren verläuft die resultierende Oberfläche durch die Kontrollpunkte. Bei den 
approximierenden Verfahren ist dies nicht unbedingt der Fall. Approximierende 
Verfahren sind in der Praxis meist einfacher zu berechnen. 


Aus didaktischen Gründen werden wir hier zuerst die Darstellung von Kur- 
ven betrachten.” Dazu werden wir in den Abschnitten 7.1 und 7.2 die appro- 


1 Alle gekrümmten Oberflächen einer Szene werden üblicherweise nach der gleichen Berech- 
nungsvorschrift dargestellt, das Abspeichern der Berechnungsvorschrift zu jeder gekrümmten 
Oberfläche ist deshalb nicht nötig. 

2Kurven werden z.B. bei der Definition von Fonts verwendet. 
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ximierenden Bezier- und B-Spline-Kurven betrachten. In den Abschnitten 
7.3 und 7.4 werden wir dann die Interpolation von Kontrollpunkten durch 
Lagrange-Polynome und B-Spline-Kurven untersuchen. Die Abschnitte 7.6 
und 7.7 beschreiben die Verallgemeinerung der in den Abschnitten 7.1 und 
7.2 eingeführten Kurven auf Bezier- und B-Spline-Oberflächen. Wegen der 
für die mathematische Formulierung verwendeten Vektor-Schreibweise besteht 
zwischen dem zweidimensionalen und dem dreidimensionalen Fall kein Unter- 
schied in der Beschreibung. In den Abbildungen werden wir der Einfachheit 
halber den zweidimensionalen Fall darstellen. Alle hier vorgestellten Verfahren 
benutzen die parametrisierte polynomielle Darstellung: Kurven im dreidimen- 
sionalen Raum werden durch drei Polynone definiert, die von einem gemein- 
samen Parameter t abhängen. Gekrümmte Oberflächen werden durch drei 
Polynone definiert, die von zwei unabhängigen Parameter s und t abhängen. 
Gute Beschreibungen der Theorie der gekrümmten Oberflächen, an denen wir 
uns teilweise orientieren, findet man u.a. in [Far90],[FvDFH90], [HL89] und 
[BG89]. 


7.1 Bezier-Kurven 


Die Methode der Bezier-Kurven ist diein der Computergraphik am längsten be- 
nutzte Beschreibung von gekrümmten Kurven. Die Theorie der Bezier-Kurven 
wurde Anfang der sechziger Jahre von Casteljau und Bezier unabhängig von- 
einander entwickelt (siehe [dC63] und [Bez67]). 


Wir nehmen im folgenden an, daß bo, : -- ,b„ die Kontrollpunkte sind, mit denen 
das Aussehen der Bezier-Kurve kontrolliert wird. In der Theorie der B&zier- 
Kurven nennt man die Kontrollpunkte auch Bezier-Punkte. Die Bezier-Kurve 
zu bo,*::,b„ hat die Eigenschaft, daß sie durch die beiden Endpunkte bo und 
b,. verläuft und daß die Steigung der Kurve in diesen Endpunkten identisch 
mit der Steigung der Geraden ist, die durch bu bzw. 5, und den unmittelbar 
benachbarten Punkt b, bzw. b,_ı verläuft. Das Aussehen der Kurven kann 
man sich wie folgt entstanden denken: Ein elastischer Stab ist an den beiden 
Endpunkten b, und 5, eingeklemmt und von den restlichen Kontrollpunkten 
wird ein Zug auf den Stab ausgeübt, der proportional zu deren Abstand vom 
unverbogenen Stab ist. Bezier-Kurven haben die angenehme Eigenschaft, daß 
sie numerisch sehr stabil sind.? 

Ein Berechnungsverfahren wird em numerisch stabil genannt, wenn die eintretenden 
Rundungs-, Abbruch- und Diskretisierungsfehler im Laufe der Berechnung abnehmen oder 


zumindest nicht zunehmen. Bei einem numerisch instabilen Verfahren können die Fehler 
zunehmen, so daß bei einer großen Anzahl von Berechnungsschritten das Ergebnis prinzi- 
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v0) 5) 


Abbildung 7.1: Veranschaulichung des Casteljau-Algorithmus für n = 3. 


Das einfachste Verfahen zur Erzeugung der zu einer Menge von Kontrollpunkten 
gehörenden Bezier-Kurve ist der sogenannte Casteljau-Algorithmus, den wir im 
nächsten Abschnitt beschreiben werden. 


7.1.1 Der Casteljau-Algorithmus 


Der Casteljau-Algorithmus läßt sich am besten durch eine geometrische Kon- 
struktion veranschaulichen: Nachdem alle Kontrollpunkte b5 = b),:..b, = 5° 
durch Geradenstücke miteinander verbunden sind, wählt man einen Parame- 
terwert t im Intervall [0 : 1]. Die im folgenden beschriebene geometrische Kon- 
struktion liefert den Punkt der Bezier-Kurve zum Parameterwert t. Für t = 0 
erhält man bo, für t = 1 erhält man b„. Auf jedem Geradenstück bPb°, , wählt 
man einen neuen Punkt bl, der das Geradenstück im Verhältnis t zu N —t teilt. 
Man erhält so n Punkte bl,---bl_,, d.h. einen Punkt weniger als es Kontroll- 
punkte gibt. Die neu erhaltenen Punkte werden wieder durch Geradenstücke 
miteinander verbunden und das Verfahren wird so lange wiederholt, bis der 
Punkt 5? konstruiert ist. bl ist der dem Parameterwert t entsprechende Punkt 


auf der Bezierkurve, siehe Abbildung 7.1. 
Der Casteljau-Algorithmus berechnet also fürl<r<n,0<ı<n-r: 
br br=! +t- (b’51 _ bi!) 
(1-2):5 +25, (7.1) 





v 


wobei 50) = b; ist.* 


piell einen beliebig großen Fehler beinhalten kann. Weitere Informationen zur Stabilität 
numerischer Verfahren findet man z.B. in [JER86] und [Sto83]. 
“Dies ist eine afline Kombination der Punkte 5}! und bi7]. 
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b"(t) = b2(t) beschreibt die Bezier-Kurve vom Grad n. Die errechneten Zwi- 
schenpunkte - auch Casteljau-Punkte genannt - werden häufig in Form einer 
Dreiecksmatrix, dem sogenannten Casteljau-Schema dargestellt: 


;o 
so zw 

BO EB :C) 
nz ze 


Man beachte, daß zur Abspeicherung ein Feld der Größe n+1 ausreicht, in dem 
die Einträge geeignet überschrieben werden. 


Bezier-Kurven haben die Eigenschaft, daß sie vollständig in der konveren 
Hülle der Kontrollpunkte liegen. Dies gilt, weil beim Casteljau-Algorithmus 
nie Punkte berechnet werden, die außerhalb des Polygonzuges liegen, der die 
Kontrollpunkte verbindet. Diese Eigenschaft kann man für den ansonsten sehr 
aufwendigen Schnittpunkttest mit gekrümmten Oberflächen ausnutzen: man 
berechnet einen Quader, der alle Kontrollpunkte und damit auch deren kon- 
vexe Hülle enthält. Wenn das mit der gekrümmten Oberfläche zu schneidende 
Objekt den Quader nicht schneidet (dies läßt sich durch einen einfachen Ver- 
gleich der Koordinatenwerte feststellen, siehe Abschnitt 8.4.2), kann es auch die 
gekrümmte Oberfläche nicht schneiden. 


7.1.2 Formulierung mit Bernstein-Polynomen 


Die Casteljau-Formulierung beschreibt Bezier-Kurven mit Hilfe der rekursiven 
Formel (7.1). Um einige wichtige Eigenschaften der Bezier-Kurven zu zeigen, ist 
es von Vorteil, eine explizite, nicht-rekursive Beschreibung der Bezier-Kurven 
zu haben. Eine solche werden wir ın diesem Abschnitt vorstellen. Wir werden 
sehen, daß sich Bezier-Kurven mit Hilfe der sogenannten Bernstein-Polynome 


(vgl. Abbildung 7.2) beschreiben lassen, siehe [For72]. 


Die Bernstein-Polynome vom Grad n sind definiert durch 


B?(t) = ( ; ) (1 - 1)“ (72) 


wobei 
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1.0 





Abbildung 7.2: Die Bernstein-Polynome B? für0 <i<3. 


ı) 0 sonst 


Daraus folgt: 


Bolt) =1 (7.3) 
B/(t)=0fürı € {0,---,n} (7.4) 
Wegen ; _ ) + ( 2 ) lassen sich die Bernstein-Polynome 


durch die folgende rekursive Formel berechnen: 
B#(t) = (1-t)BP'(t) +tBE (t) (7.5) 


Wegen (a+b)" =), ( ; ) a'b"* gilt außerdem: 


5 B’(t)=1 (7.6) 


i=0 


Das Bernstein-Polynom B}(t) hat nur ein Maximum, das für den Wert t = ı/n 
angenommen wird. Der Casteljau-Punkt bj(t) zum Parameterwertt (O<r<n, 
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0 <i<n-r) kann mit Hilfe der Bernstein-Polynome wie folgt dargestellt 
werden: 


K)=-YiuBie) o<ısı an 


j=0 


Für r = n und i = 0 erhält man daraus die Bezier-Kurve, die sich damit 


darstellen läßt als: 


br) =) 3,BR(ı) 17.8) 


Diese Formel beschreibt den direkten Zusammenhang zwischen der Bezier- 
Kurve und den Bezier-Punkten. Die Bernstein-Polynome treten als Gewichts- 
funktion auf, die angeben, wie stark die einzelnen Kontrollpunkte berücksichtigt 
werden. Die Bernstein-Polynome erfüllen auch die für Gewichtsfunktionen ty- 
pische Gleichung (7.6). Man kann sich Formel (7.8) wie folgt veranschaulichen: 
Man stelle sich die Kontrollpunkte gleichmäßig auf die Parameterwerte zwi- 
schen 0 und 1 aufgeteilt vor, d.h. Kontrollpunkt b; ist Parameterwert t; = i/n 
zugeordnet. Den z-Koordinatenwert (y-Koordinatenwert, z-Koordinatenwert) 
der Bezier-Kurve für Parameterwert t erhält man dadurch, daß man b; mit dem 
Wert von B?(t) wichtet und alle so erhaltenen Werte aufsummiert. Wie man 
aus Abbildung 7.2 ersieht, ist der Wert von B}*(t) dabei umso kleiner, je weiter 
t von dem b; zugeordneten Parameterwert t; weg liegt. D.h. 5; wird zur Be- 
rechnung des Wertes der Bezier-Kurve an Stelle t umso weniger berücksichtigt, 
je weiter t; von t weg liegt. Das genaue Maß der Berücksichtigung ergibt sich 
aus dem Verlauf des Bernstein-Polynoms B?(t). In Abbildung 7.2 sieht man 
auch, daß alle B#(t) für £t # 0 und t # 1 einen positiven Wert haben. Das 
bedeutet, daß für Werte t mıt 0 < t < 1 alle Kontrollpunkte zur Berechnung 
der Bezier-Kurve berücksichtigt werden. 


Formel (7.7) läßt sich durch Induktion wie folgt beweisen: 


Ei) = DEusBte) = Bil) = 5 
Kl) = A-)EW)+ Lk 


r—1 r—1 


(1-1) 3,54 B5() +1) Burns BE) 


=0 j=0 
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i+r—1 i+r 
= (1-21) ), 5Bi-l@)+t ), 5BiZL 1) 
jzi j=i+1 
i+r i+r 
= (1-1) 5 Bi) +2) Bil 1) 
j=i j= 
s+r _ 
= Sb; (1 -2)BiZH(e) +EBIZL,(e)] 
j=i 
s+r 
= b; Bi_;(t ) 
j=i 


Y_ b;+;B5(t) 
j=0 


Die vierte Gleichheit gilt, weil B-!(t) = B”7'(t) = 0 wegen (7.4). Aus der Dar- 
stellung mit Bernstein-Polynomen lassen sich einige interessante Eigenschaften 
der Bezier-Kurven herleiten, auf die wir im folgenden kurz eingehen. 


Bezier-Kurven haben die wichtige Eigenschaft der affinen Invarianz: Das An- 
wenden einer affinen Abbildung ® auf die Kontrollpunkte und das nachfolgende 
Berechnen der Bezier-Kurve führt zu der gleichen Kurve, die man durch An- 
wenden von © auf die ursprüngliche Kurve erhält, d.h. es gilt: 


8(6°(t))= I ,5b,)BFL) (7.9) 


j=0 


Diese Eigenschaft läßt sich wie folgt beweisen: Eine affine Abbildung ® : IR?’ — 
IR® läßt sich darstellen als: 


(2) = A z+V 


wobei A eine 3 x 3-Matrix ist und U ein Vektor, vgl. Abschnitt 3.1. Sei ® eine 
beliebige affine Abbildung der obigen Form. Es gilt: 


EB) = A-(EB5) +5 


j=0 


> BF(t)A-b; + > BF(t)v wegen (7.6) 


j=0 j=0 
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n 


I BC)A bi +6) 


j=0 


n 


) .B*(t)8(b,) 


j=0 


Die Eigenschaft der affınen Invarianz erlaubt es, eine auf eine gekrümmte 
Oberfläche anzuwendende afline Abbildung (z.B. Rotation) vor der Darstellung 
der Oberfläche auf die - üblicherweise nicht sehr zahlreichen - Kontrollpunkte 
anzuwenden anstatt nach der Darstellung auf alle Punkte der gekrümmten 
Oberfläche. Dies führt zu einer erheblichen Verringerung des Rechenaufwan- 
des. 


Bezier-Kurven haben dagegen nicht die Eigenschaft der projektiven Invarianz: 
Das Anwenden einer perspektivischen Projektion auf die Kontrollpunkte und 
das nachfolgende Berechnen der Bezier-Kurve führt üblicherweise zu einer an- 
deren Kurve wie das Anwenden der Projektion auf die ursprüngliche Kurve. 
Nähere Einzelheiten hierzu findet man z.B. in [Far90]. 


Wie bereits erwähnt interpoliert eine Bezier-Kurve die beiden Kontroll- 
Endpunkte bo und b„. Dies gilt, weil wegen 


B5(0) = Bill) =1 (7.10) 
und (7.6) gilt: 
b"(0) = bo 
b’(1) = 


Die Geradenstücke bobı und b„-ıb„ sind Tangenten an die Bezier-Kurve, d.h. 
die Bezier-Kurve hat an den beiden Endpunkten die gleiche Steigung wie der 
Kantenzug, der die Kontrollpunkte miteinander verbindet. Zum Beweis dieser 
Aussage müssen wir den Tangentenvektor für die Endpunkte der Bezier-Kurve 
berechnen. Den Tangentenvektor zu einem Punkt der Bezier-Kurve erhält man 
durch Einsetzen des zugehörigen Parameterwertes in die Ableitung der Bezier- 
Kurve. Für die Ableitung des Bernstein-Polynoms Bf erhält man: 


BE) = n(Bi'(t) - BE) 


wie man durch einfaches Nachrechnen überprüfen kann. Damit gilt für die 
Ableitung der Bezier-Kurve b"(t): 
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d ın . 7 n- n- 
er. () = n) 5;(B}7 (t) -B; ‘(t)) 
vr 
n _ ni 
= n),5Bi(t)-n) b;B7'(t) wegen (7.4) 
3=1 3=0 


n-1 n-1 

= n Y, b;4,B}7' (t) —_n Y, b,B?"'(t) 
j=0 j=0 
n-1 


= nz -B)B7 


Einsetzen der zu den beiden Endpunkten bo und b,, gehörenden Parameterwerte 
t = 0 und t = 1 bringt wegen (7.10) und (7.6) die Bestätigung der obigen 
Aussage: 


ik 
3 

nn 

oO 

ed 
| 


= n(bı - bo) 
—b(1) = n(bn - bu-ı) 


Wenn die Kontrollpunkte auf einem Geradenstück zwischen den Punkten 5 und 
q gleichmäßig verteilt sind, d.h. wenn 


für 0 < j <.n, so verbindet die zugehörige Bezier-Kurve 5 und Z durch eben 
dieses Geradenstück. Dies gilt wegen %;_, ZB#(t) = tt und B#{t) = B,_;(1-t): 





b*(t) = ) 5;BF(t) 
= > a - 24 3 B}(t) 
— >> ie Br; -1)+ >> JBr(i) 


= (l1-t)ö+tg 
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Wenn die Kontrollpunkte keinen gleichen Abstand voneinander haben, ist die 
resultierende Bezierkurve ebenfalls eine Gerade, die aber nicht linear parame- 
trisiert ist. 


Die Parameterwertet =0 und t = 1 sind die beiden einzigen, für die bei der Be- 
rechnung des Kurvenpunktes nur ein Kontrollpunkt berücksichtigt wird. Wie 
bereits erwähnt werden für alle anderen Parameterwerte alle Kontrollpunkte 
berücksichtigt, weil für diese Werte t alle Bernstein-Polynome einen Wert un- 
gleich Null haben. Diese Eigenschaft führt dazu, daß Bezier-Kurven lokale 
Eigenschaften der Kontrollpunkte u.U. wenig berücksichtigen. Dies gleicht 
normalerweise Unregelmäßigkeiten der Kontrollpunkte aus, kann aber auch zu 
unerwünschten Ausgleichseffekten führen (siehe Abbildung 7.3). Ein weiterer 
Nachteil der Bezierkurven besteht darin, daß die resultierende Kurve an einigen 
Stellen evtl. nicht differenzierbar ist, d.h. die Kurve hat an diesen Stellen un- 
erwünschte Spitzen, siehe Abbildung 7.3. Dies kann passieren, wenn Schleifen in 
dem Kantenzug enthalten sind, der die Kontrollpunkte miteinander verbindet. 


Weitere interessante Eigenschaften der Bezierkurven, die den Rahmen dieses 
Buches sprengen würden, findet man in [Far90] und [HL89]. 


7.1.3 Zusammengesetzte Bezier-Kurven 


Wie im letzten Abschnitt erwähnt wurde, treten bei Bezierkurven manchmal 
unerwünschte Ausgleichseffekte auf, die dazu führen, daß die Bezierkurve rela- 
tiv weit von den Kontrollpunkten entfernt verläuft. Damit verbunden ist die 
Tatsache, daß man zum Nachbilden komplexer realer Kurven evtl. viele Kon- 
trollpunkte setzen muß, damit die Bezierkurve mit der realen Kurve in etwa 
übereinstimmt. Dies macht die mathematische Beschreibung der Bezierkurve 
unhandlich und die Berechung ist rechenzeitintensiv. 


Der Grund für die unerwünschten Ausgleichseffekte liegt darin, daß zur Be- 
rechung eines Punktes der Bezierkurve nicht nur die benachbarten Kontroll- 
punkte, sondern alle Kontrollpunkte berücksichtigt werden. Dabei können sich 
bei ungünstiger Lage die Einflüsse der verschiedenen Kontrollpunkte gegenseitig 
eliminieren, was zu Kurvenlagen ähnlich der in Abbildung 7.3 wiedergegebenen 
führen kann. Die Berücksichtigung aller Kontrollpunkte ist auch der Grund für 
die hohe Rechenzeit bei Verwendung vieler Kontrollpunkte. 


Man kann die beschriebenen Nachteile dadurch vermeiden, daß man die Kon- 
trollpunkte abschnittweise durch Bezierkurven approximiert, d.h. man unter- 
teilt die Kontrollpunkte in mehrere Gruppen gı,''',9m gleicher Größe, wobei 
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Abbildung 7.3: Diese Abbildung zeigt ein paar Beispiele für das Aussehen von B£zier- 
Kurven. In den oberen beiden Beispiele zeigen die Bezier-Kurven gute Ergebnisse. Für 
manche Mengen von Kontrollpunkten zeigen die B&zier-Kurven aber unerwünschte Spit- 
zen (siehe Mitte links und unten rechts), für andere kommt es zu unerwünschten Aus- 
gleichseffekten (siehe Mitte rechts und unten rechts). 
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die Kontrollpunkte in einer Gruppe benachbart sind und untereinander die glei- 
che Ordnung haben wie vor der Gruppierung. Die Gruppen bestehen üblicher- 
weise aus drei bis fünf Kontrollpunkten. Jede Gruppe von Kontrollpunkten 
wird durch eine Bezierkurve (geringen Grades) approximiert, die Gesamtkurve 
ergibt sich als Aneinanderreihung der einzelnen Teil-Be&zierkurven. 


Gruppe g; bestehe aus n+ 1 Kontrollpunkten bo;,- : - ,dni. Wir nehmen hier an, 
daß die Gesamtkurve über dem Intervall [0, 1] definiert ist. Die i-te Einzelkurve 
(auch Segment genannt) sei über dem Intervall [u;,u;+1] definiert, wobei 0 = 
Up < U << Um < Um+ı = l eine Zerlegung des Intervalls [0, 1] beschreiben. 
Damit gibt es für jeden Parameterwert u € [0,1] ein eindeutiges Intervall I; = 
[u;,u;+1] mit u € I;. Der zugehörige Punkt auf der Gesamtkurve wird durch 
das dem Intervall /; zugeordnete ı-te Segment 5’ beschrieben. Wir können für 
das Intervall /; lokale Parameterwerte einführen, indem wir 


u-u u-u 





' Ur %i A; 

setzen. Wenn der globale Parameterwert u zwischen u; und u;,ı variiert, vari- 
iert t zwischen 0 und 1. Der globale Parameterwert u wird meistens verwendet, 
um die Gesamtkurve zu beschreiben, der lokale Parameterwert t, um die Einzel- 
kurven zu beschreiben. Unter Verwendung der lokalen Parameterwerte erhalten 
wir für das :-te Segment die Gleichung 


Be(t) = S3,B(0) mitte [0,1] 


j=0 


Damit die Gesamtkurve stetig ist, muß der Endpunkt des i-ten Segments mit 
dem Anfangspunkt des (? + 1)-ten Segments übereinstimmen, d.h. es muß 


bB(1)= 52,00) fürl<i<m 


gelten. Wegen (7.10) und (7.6) erreicht man dies dadurch, daß 


bi = basirı (7.11) 


ist, d.h. der letzte Kontrollpunkt des :-ten Segments fällt mit dem ersten Kon- 
trollpunkt des (i + 1)-ten Segments zusammen. Diese Forderung folgt auch 
einfach aus der Tatsache, daß jede Einzel-Bezier-Kurve ihren ersten und letz- 
ten Kontrollpunkt interpoliert. 
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Neben der Stetigkeit der Gesamtkurve verlangt man üblicherweise auch, daß 
die Gesamtkurve an den Intervallpunkten differenzierbar ist, d.h. daß gilt: 


(20) (1) = (z - 2) (0) (7.12) 


Wegen der Kettenregel ist 


d-, d-.,,, dt 
AG a" t), 
-1 
1 
= n ‚0 du BE" mn 
_e j+1,5 di) (t an u; 
und analog 
En ya BR) 
du 77 Fer st1+1 n+1)/)45 Ur — Urrı 
Wegen (7.10) und 0 gilt (7.12), wenn 
n _ _ 
nn br — In-1,) = 111771 +1 790, 
Ur — U Pa) U4+2 — Url ui = Boirı) 
Wegen b,„; = bo.it wird dies zu 
(ui+2 — u+1)(bri u bn-1,) Z— (Ui4ı — w)(dı,H = Bi) (7.13) 


Dies bedeutet, daß die drei Punkte b,-ı Fr bus = bo + und b, „+ı kKollinear sein 
müssen und daß b„; die Strecke (b1;41 — bn-ı;) im Verhältnis (wir — u;) : 
(U42 — Urı) teilt. Man beachte, daß die Kollinearität der drei Punkte alleine 
nicht ausreicht, um die Differenzierbarkeit an den Intervallpunkten sicherzustel- 
len. Zu dieser Annahme könnte die im letzten Abschnitt bewiesene Tangenten- 
Eigenschaft (7.11) der Bezier-Kurven verleiten. Hier spielt aber zusätzlich die 
Unterteilung der Parameter-Intervalle eine wichtige Rolle. 


Wir gehen hier nicht weiter auf die Technik der zusammengesetzten Bezierkurven 
ein. Eine ausführliche Behandlung findet man z.B. in [Far90] und [HL89]. Der 
Nachteil der zusammengesetzten Bezierkurven besteht darin, daß die ersten und 
letzen Kontrollpunkte jeder Gruppe die Bedingungen (7.11) und (7.13) erfüllen 
müssen. Wenn die Kontrollpunkte diese Bedingungen nicht erfüllen, müssen 
vor der Gruppierung der Kontrollpunkte zusätzliche Kontrollpunkte eingefügt 
werden, die die stetige Differenzierbarkeit der Gesamtkurve sicherstellen. Dieser 
zusätzliche Aufwand muß bei den im nächsten Abschnitt behandelten B-Spline- 
Kurven nicht getrieben werden. 
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7.2 B-Spline-Kurven 


Die Idee der B-Spline-Kurven besteht darin, das gegebene Parameterintervall, 
über dem die Approximationskurve gezeichnet werden soll, entsprechend den 
Kontrollpunkten in Teilintervalle zu zerlegen. Wir legen hier wieder [0 : 1] 
als Parameterintervall zugrunde. Über jedem Teilintervall wird eine Teilkurve 
gezeichnet. An den Intervallgrenzen sollen die einzelnen Teilkurven so an- 
einander stoßen, daß eine glatte Gesamtkurve entsteht. Der Unterschied zu 
den zusammengesetzten Bezierkurven besteht darin, daß wir hier keine Be- 
schränkungen für die Lage der Kontrollpunkte festlegen wollen. Wir werden se- 
hen, daß sich dies durch Verwendung einer anderen Gewichtsfunktion (anstatt 
der Bernstein-Polynome werden B-Spline-Funktionen verwendet) realisieren 
läßt. Wir betrachten im folgenden hauptsächlich kubische B-Spline-Kurven, 
d.h. die Teilkurven werden durch kubische Funktionen dargestellt. Wir ge- 
ben aber eine allgemeine Definition der B-Spline-Funktionen, damit der Leser 
bei Bedarf auch mit B-Spline-Kurven höherer Ordnung arbeiten kann. Zuerst 
stellen wir jedoch den de-Boor-Algorithmus vor, ein einfaches geometrisches 
Verfahren zur Konstruktion von B-Spline-Kurven. 


7.2.1 Der De-Boor-Algorithmus 


Der de-Boor-Algorithmus (vgl. auch [Far90] und [HL89]) ist das Äquivalent 
des Casteljau-Algorithmus für B-Spline-Kurven. Er ermöglicht die Konstruk- 
tion von B-Spline-Kurven beliebigen Grades ohne Kenntnis der B-Spline- 
Funktionen. Ebenso wie die Bezier-Kurven werden die B-Spline-Kurven mit 
Hilfe einer Menge von Kontrollpunkten bo,---,d„ definiert, wobei jetzt den 
Kontrollpunkten Parameterwerte wo,‘ ‚u, zugeordnet sind mit 0 < w <S 
u << un < 1. Man stelle sich die Kontrollpunkte wie beim Casteljau- 
Algorithmus wieder durch einen Polygonzug miteinander verbunden vor. Die 
Berechnung des zu einem Parameterwert u, uo < u < u„ gehörenden Punktes 
auf der durch bo,'--,b„ definierten B-Spline-Kurve vom Grad k besteht aus 
k — 1 Iterationen, wobei in Iteration r, 0 <r < k, k—r neue Punkte berechnet 
werden. Sei u € [u.,üz+ı| für ein z mit 0 < x <n. Der de-Boor-Algorithmus 
berechnet fürr0O<r<kunde—-k+r<ı<zr 


or) _ Urrk-r — U or”) + uU eV (7.14) 

U;+k-r — Ur Urk-r — U 
wobei wir 50) =-b,0 <i<nb, =bn =. = b_k+ı = (, und 
uU] = U2 =" = Ur4ı = 0 annehmen. 2) ist der gesuchte Punkt auf 
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der B-Spline-Kurve. Geometrisch kann man sich das Verfahren wie folgt ver- 
anschaulichen: Die in Iteration r errechneten Punkte ersetzen die Punkte aus 
Iteration r — 1 in dem Polygonzug, der die Kontrollpunkte miteinander ver- 
bindet und der Polygonzug wird entsprechend neu gezeichnet. Das Verfahren 
ähnelt also dem beim Casteljau-Algorithmus angewendeten, nur daß hier nicht 
notwendigerweise alle Kontrollpunkte beteiligt sind. Mit 


uw 
a ———— 
Urk-r — U 


kann man (7.14) auch darstellen als 


Ir = (1-5) + ae) (7.15) 


Ein Vergleich mit (7.1) zeigt, daß dies eine sehr ähnliche Formel wie die beim 
Casteljau-Algorithmus verwendete ist. (7.15) ist allgemeiner als (7.1) wegen 
der Verwendung von o?. (7.15) geht in (7.1) über, wenn wrk=n+lund 0 = 
U <U=''=W-ı = Un = 1 setzen. Außerdem haben wir oben u_ı = "= 
U_n = 0 gesetzt. Wegen z = 0 für alleu, u Su <S un, ist ur = l und u; = 0 
für alle erlaubten r und ,d.h. fürrO<r<kundz-k+r<ıi< ce. Damit wird 
a! = u. Das bedeutet, daß Bezier-Kurven ein Spezialfall von B-Spline-Kurven 
sind. Ebenso wie die vom Casteljau-Algorithmus errechneten Zwischenwerte 
lassen sich die vom de-Boor-Algorithmus errechneten Zwischenwerte in einem 
übersichtlichen Schema darstellen: 


(0) 


b2_ +1 = b,_k+1 

bz-k42 = SR DR 

_ _ _ nn 

EHE u Fe N PEEEREE EEE ars, 

ee Sun >) Er u En > 


Ebenso wie beim Casteljau-Algorithmus werden beim de-Boor-Algorithmus 
nie Punkte berechnet, die außerhalb des Polygonzuges liegen, der die Kontroll- 
punkte verbindet. Deshalb haben auch die B-Spline-Kurven die Eigenschaft, 


vollständig in der konvexen Hülle der Kontrollpunkte zu liegen. 
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7.2.2 _ B-Spline-Funktionen 


Wir nehmen wieder an, daß 0 = w < ul << um = 1 eine Zerlegung 
des Intervalls [0,1] beschreibt. Ausgehend von der B-Spline-Funktion erster 
Ordnung 
Ara: < 
NW=1ı fürs Su<u für O<i<m 


0 sonst 


definieren wir die (normalisierten) B-Spline-Funktionen der Ordnung k durch 


— EN) + th U Nu) (7.16) 


U+k-1 — Ui U+k — Ur 


N; (u) = 


für0 <i<m-k. Man erhält den Wert N*(u) also durch gewichtete Mittelung 
der Werte N*"'!(u) und N};,'(u) (vgl. [dB72]). NF(u) ist auf dem Intervall [0, 1] 
definiert und beschreibt ein Polynon vom Grad k - 1, das nur auf dem offenen 
Intervall ]u;, w;+x| einen von 0 verschiedenen Wert annimmt, d.h. es gilt: 


N#(u) =0 füru<u; oder uw> ur (7.17) 


Ne(w)>0 fürw<u<usr (7.18) 


Dies läßt sich einfach durch Induktion zeigen. Die Ableitung der B-Spline- 
Funktionen ergibt sich allgemein zu 


k-1 


du ' U+k-1 — Ui Ui+k — Uir+1 


NEU) = — NE lu) - New) (7.19) 


Eine wichtige Eigenschaft der B-Spline-Funktionen ist ihre lineare Unabhängig- 
keit, d.h. wenn 


5 cNF(u) =0 (7.20) 


ı=0 


dann ist c; = 0 für alle: mit 0 <ı <m-—k. Zum Beweis betrachten wir ein 
Intervall I, = [u,, uz+1|, d.h. u € I,. Wegen (7.17) wird (7.20) zu 


c+l 
Y, NFw=0 füruel, 


t=r—k+1 
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Wegen (7.18) gilt aber N*(u) > Ofüru € [u,u4,[unde—k+1l <i<c+l. Also 
kann (7.20) nur erfüllt sein, wenn ;=0 für lee mtr -k+1l<ı:<cHl. 
Da z mit 0 <xz < m- k beliebig gewählt war, folgt c; = 0 für alle : mit 
0<i<m-k. Da die B-Spline-Funktionen NF linear unabhängig sind, kann 
man sie als Basis für jedes über [0, 1] stückweise definierte Polynom vom Grade 
k—1 verwenden. Daher rührt auch der Name: B-Spline steht für Basis-Spline. 


Die normalisierten B-Spline-Funktionen haben auch die für Gewichtsfunktio- 
nen typische Eigenschaft 


m-k 
2» N#(u) =] für u E [ur-ı, Um-R+1] 


t=0 


Einen Spezialfall der normalisierten B-Spline-Funktionen erhält man, wenn 
man die Intervallpunkte uo,'--,uUm äquidistant zwischen 0 und 1 verteilt, 
d.h. wenn man u; = i/m setzt. (7.16) wird dann zu: 


mu —ı 


k—-1 


ıw+k—- mu 
k-1 





N} (u) = N? (u) + N: (w) (7.21) 


Die so entstehenden B-Spline-Funktionen nennt man uniforme B-Spline- 
Funktionen. Wir werden uns im folgenden auf die Betrachtung der uniformen 
B-Spline-Funktionen beschränken. Die Formel (7.21) hat den Nachteil, daß sie 
von der Anzahl der Intervallpunkte abhängt. Dies ist unpraktikabel, weil man 
für verschiedene Anzahlen von Intervallpunkten verschiedene Formeln erhält. 
Aus diesem Grund verwenden wir anstatt dem Parameterwert u den skalierten 
Parameterwert x = mu, (7.21) wird damit zu 


ı+k—-xr 


C—ı HL 
N’@)= N @)+ 


NE (z) (7.22) 


Damit erhält man für N}: 


z fürze [0,1[ 


N!(z) = zN!(z)+(2-z)N!(x) = | 2-x fürze[l,2| 


und allgemein für N?: 


2 _ tTt—i für ze: +1l[ 
Na) =! 2+:-z fürrefi+l.:+2[ 
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04 WM MM 


0 l 2 3 4 5 6 
Abbildung 7.4: Darstellung von N?(z). 


Der Graph der Funktionen N? ist in Abbildung 7.4 wiedergegeben. Wie man 
sieht, entsteht N?,, aus N? durch eine Verschiebung um 1 nach rechts, d.h. durch 
eine Translation des Argumentwertes um Ar = —1. Es ist also: 


N2,(@)= N?(@-1)=--=Nle-i-1) 


Diese Translationsinvarianz kann man nach [HL89] durch die folgende Parame- 
tertransformation erfassen. Man setzt: 


w=r(modl) (7.23) 
d.h. für x e [0,1| ist x = w 
für ze [1,2[it 2=w+l 
für ze 2,3[it 2=w+2 
usw., wobei jeweils w € [0,1[. Damit erhält man: 


No(w) 
N, (w) 


wNg(w) + (1 - w)N, (w) 
uN, (w)+(1-w)N;(w) 


und allgemein 


N;(w) = wN;(w) + (l-w)N;,1(w) 
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Für k=3 erhält man aus (7.22): 


No (=) 


Eon 3-12 
>No (z) + —. N (z) 
= Z(wNi(w) + (1 -w)N}w)) + (wN}(w) + (1 - w)N)(w)) 


Nach der Parametertransformation (7.23) wird daraus: 








w? 1+w)(1-w)+(2- w)w 1- w)? 
Ni) = na) 4 nu) 
w? 2w? +2w+1 1- w)? 
= ac) a FH u eu) 
und allgemein 
w? -2w? +2w+1 1 - w)2 
Analog erhält man: 
4 ww, 3w? +3w+3w+1,, 
Ni) = ns) FR Hin (u) 
zw? — 6w? +4 1- w)? 
tin (w+ EIN W) (724) 


6 


Die Graphen dieser beiden Funktionen sind in Abbildung 7.5 wiedergegeben. N} 
gibt die kubischen B-Spline-Funktionen an, die in der Praxis häufig verwendet 
werden. Für größere Werte von k werden die durch die B-Spline-Funktionen 
beschriebenen Glockenkurven flacher und breiter. Wie man an Abbildung 7.4 
und 7.5 sieht, haben die B-Spline-Funktionen die folgenden Eigenschaften: 


eo N*(z) nimmt für i <z<i+ keinen Wert # 0 an und hat als Symme- 
triestelle den Punkt x = x +:,an dem auch das Maximum angenommen 


wird (siehe Abbildung 7.5). 
e N#(z) ist an den StellentmitteIN ‚i<t<i+k (k- 2)-fach stetig 


Ein formaler Beweis dieser Eigenschaften kann durch Nachrechnen erbracht 
werden, siehe auch [HL89]. 
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1.0 - 
N N N 


Abbildung 7.5: Darstellung von N?(z) und N#(z). 
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7.2.3 B-Spline-Kurven 


Ebenso wie die Bezier-Kurven werden die B-Spline-Kurven mit Hilfe einer 
Menge von Kontrollpunkten bo, : : ,b„ definiert. Die die B-Spline-Kurven defi- 
nierende Formel unterscheidet sich von der die Bezier-Kurven definierenden 
im wesentlichen in der Wahl der Gewichtsfunktion: anstatt der Bernstein- 
Polynome werden die B-Spline-Funktionen verwendet. Die B-Spline-Kurve 


der Ordnung k zu den Kontrollpunkten bo, : -: ‚br ist definiert durch: 


__ k 
5.(u) = > b,NF(u + 5) für Up <u<u, (7.25) 


ı=0 


wobei wir n > k — 1 annehmen, d.h. für die B-Spline-Kurve der Ordnung 
k verwendet man mindestens k — 1 Kontrollpunkte. Weiter nehmen wir an, 
daß uniforme B-Spline-Funktionen verwendet werden, d.h. der Berechnung der 
B-Spline-Funktionen liegt eine äquidistante Zerlegung des Intervalls [0,1] mit 
den Intervallpunkten 0 = uo,''*,Un+r = 1 zugrunde Mitm=n+k, ist 
u; = i/m. Wir nehmen an, daß dem Kontrollpunkt b; der Intervallpunkt u; zu- 
geordnet ist. Damit ist die B-Spline-Kurve 3,(u) genau für die Parameterwerte 
definiert, die zwischen den Intervallpunkten von bo und b, liegen. Die Intervall- 
punkte un41,°°',Un+r werden gebraucht, damit die B-Spline-Funktionen für 


alle © wohldefiniert sind, vgl. Definition (7.16). 


Gleichung (7.25) bestimmt, daß man den x-Koordinatenwert (y-Koordinaten- 
wert, z-Koordinatenwert) der B-Spline-Kurve 5; für Parameterwert u dadurch 
erhält, daß man b; mit N*(u + 5) wichtet und alle so erhaltenen Werte auf- 
summiert. Die Addition von k/2m zum Parameterwert u dient dazu, die ver- 
wendete B-Spline-Funktion “an die richtige Stelle zu rücken”: Die Funktion 
N*(u) nimmt ihr Maximum für u= u + 5 an. Die Addition von k/2m be- 
wirkt ein Verschieben der Funktion um k/2m nach links, das Maximum wird für 
u = u; angenommen. Das bewirkt, daß Kontrollpunkt b; zur Berechnung der B- 
Spline-Kurve an dem b; zugeordneten Intervallpunkt u; maximal berücksichtigt 
wird. Für alle anderen Parameterwerte u wird b; umso weniger berücksich- 
tigt, je weiter u von u; weg liegt. Das Maß der Berücksichtigung wird vom 
Aussehen der verwendeten B-Spline-Funktion bestimmt. Man kann sich die 
Berechnung der B-Spline-Kurve so vorstellen, daß über jedem zu einem Kon- 
trollpunkt b; gehörenden Intervallpunkt u; eine Glockenkurve - die verwendete 
B-Spline-Funktion NF - gezeichnet wird. Wenn die Glockenkurve zu b; für den 
gegebenen Parameterwert u einen Wert # 0 hat, wird b; zur Berechnung der 
B-Spline-Kurve entsprechend diesem Wert berücksichtigt. Ansonsten wird b; 
nicht berücksichtigt. 
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Ur-1 Ur U Ucı Ur+2 


Ur-1 Ur MgUc+ Ur+2 


Abbildung 7.6: Veranschaulichung der berücksichtigten Kontrollpunkte bei der Berech- 
nung eines Punktes 3,(1) der B-Spline-Kurve. Die Kontrollpunkte sind in der Abbildung 
durch ihre zugeordneten Parameterwerte repräsentiert. Für gerades k (in der oberen Ab- 
bildung für den Fall k = 4 dargestellt) werden genau die Kontrollpunkte berücksichtigt, 
deren zugeordnete Parameterwerte nicht mehr als k/2 Positionen links oder rechts von u 
liegen. Für ungerades k (in der unteren Abbildung für den Fall k = 3 dargestellt) hängen 
die berücksichtigten Kontrollpunkte von der genauen Lage von u ab. u liege im Intervall 
I; = [ür,tr+ı], dessen Mittelpunkt m, = (U, + üz+ı) ist. Wenn u = ur < m,, 
werden die Kontrollpunkte berücksichtigt, deren zugeordneter Parameterwert entweder 
[#] Positionen links oder |%| Positionen rechts von u: liegen. Wenn u = u, > m,, 
werden die Kontrollpunkte berücksichtigt, deren zugeordneter Parameterwert entweder 
[| Positionen links oder [#] Positionen rechts von u; liegen. 
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Das bedeutet, daß zur Berechnung der B-Spline-Kurve für einen bestimmten 
Parameterwert u nur einige wenige Kontrollpunkte berücksichtigt werden. Wie- 
viele dies genau sind, hängt vom Grad der verwendeten B-Spline-Funktion 
ab. Bei Verwendung der B-Spline-Funktionen vom Grad k werden für Pa- 
rameterwerte, die nicht mit Intervallpunkten zusammenfallen, genau k Kon- 
trollpunkte berücksichtigt, vgl. Abbildung 7.6. Dies liegt daran, daß die B- 
Spline-Funktionen vom Grad k sich über k Intervalle erstrecken und es für 
jeden nicht mit einem Intervallpunkt zusammenfallenden Parameterwert genau 
k B-Spline-Funktionen gibt, die an dieser Stelle einen Wert ungleich 0 ha- 
ben. Für Parameterwerte, die mit einem zu einem Kontrollpunkt gehörenden 
Intervallpunkt zusammenfallen, werden dagegen für gerade k nur k—1 Kontroll- 
punkte berücksichtigt. Dies sieht man am kubischen Fall (k = 4), wenn man 
z.B. den zu Kontrollpunkt b; gehörenden Intervallpunkt u; in (7.25) einsetzt: 


_ ae 4 
3.(u;) = I 5 Nu; + 57) 


ı=0 


NF(u; + +) ist wegen (7.17) ZO für <w;+ 2 < u+4. Im Falle der 
uniformen Parametrisierung vereinfacht sich das zu? —-—2 < 5 <i+2 oder 
35-2<t<yj +2. Zur Berechnung von 3,(u;) werden also nur die Funktionen 
N’_1,N}, N}, einen Wert # 0 beisteuern und man erhält nach Anwenden der 


beiden Parametertransformationen z = mu und x = w(mod 1) aus (7.24): 


_ 2 - 2 - 2 
3,(u) = b;-1N}_ (u; + —)+b;N;(u; + —) + bj N zu + —) 


= 5.101,60 +2)+5,N?G +2) + 5uN} 160 +2) 
l- 2- 


1_ 
= 5-1 + 3B; + gt (7.26) 


Man beachte, daß wegen x = mu die Argumente von N?_,,N# und N},, ganz- 
zahlig sind, d.h. in (7.24) ist w = 0. Außerdem beachte man, daß die N? 
abschnittweise definierte Funktionen sind. Es steuert also nur einer der Sum- 
manden in (7.24) einen Wert bei, nämlich genau der, der den Abschnitt definiert, 
in dem das Argument liegt. Also liefert z.B. für N/_,(j+2) nur der letzte Sum- 


mand GUN, einen Wert ungleich Null. Da das Argument 2 = j +2 von 
N}_, ganzzahlig ist, ist wegen w = x(mod 1) w = 0 und der Summand lie- 
fert 1/6. Den gleichen Wert erhält man natürlich auch bei Verwendung der 


rekursiven Gleichung (7.16). 
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Abbildung 7.7: Diese Abbildung zeigt Beispiele für das Aussehen von B-Spline-Kurven. 
Wir haben die gleichen Mengen von Kontrollpunkten gewählt wie in der Abbildung für die 
Bezier-Kurven, damit der Leser die entstehenden Kurven miteinander vergleichen kann. 
Man sieht, daß die B-Spline-Kurven die bei den Be&zier-Kurven auftretenden Spitzen 
und unerwünschten Ausgleichseffekte nicht enthalten. Dafür zeigen die B-Spline-Kurven 
in der Nähe der End-Kontrollpunkte z.T. ein recht merkwürdiges Verhalten. Dies wird 
insbesondere in den rechten Abbildungen deutlich. 
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Daß (7.25) die gleiche Kurve beschreibt wie der de-Boor-Algorithmus aus Ab- 
schnitt 7.2.1, sieht man wie folgt. Seı W=u+ 2 Es gilt: 


Bu) = Done) 


ı=0 

_ 5, NEN ZU nit 
2% Ss 1% w)+ Ur Ur u) 

n+1 K_ u 

_ 5 —— NH (u) + NE 
DL Ui+k-1 — Ui ( 2 Ur+k-1 — U (u ) 
n+1 

— > b;(u — u;) + bi-1(ui4k-ı — u) N! (uf) 
Oo Ui+rk-ı — Ui 
n+l 

= BO NE! (u‘) 
ı=0 


Dabei haben wir b_ı = bn+ı = 0 angenommen. 5) ist der Wert aus Gleichung 
(7.14). Durch r-maliges Wiederholen dieses Prozesses erhält man: 


3 = ONE 
i=0 
Fürr=k _ı ergibt sich schließlich 
n+k-1 
5.(u) = >, BD NEU‘ ) 
i=0 
Dabei ist bar =z..= Dn+k-ı = (. Wenn wir annehmen, daß u, < u < Us 


ist, gilt: 


3,(u) = DEM) 


weil N!(u') = 1. Alle anderen Funktionen liefern 0. 
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Die Ableitung der B-Spline-Kurven ergibt sich aus (7.19) zu 


bi = Bin NF-!(u) (7.27) 


Ur+k-1 — Ur 


Z3u(u) = (k-1) > n 
(vgl. [dB72]). B-Spline-Kurven haben den Nachteil, daß sie zwar im Innern 
der Kurven gute Ergebnisse zeigen, daß sie aber an den Randpunkten oft nicht 
die gewünschte Form haben. Dies sieht man auch an Abbildung 7.7, die die‘ 
B-Spline-Kurven für die gleichen Kontrollpunkte darstellt, die in Abbildung 
7.3 für die Bezier-Kurven verwendet wurden. Man sieht an Abbildung 7.7, 
daß die B-Spline-Kurven nicht die angenehme Eigenschaft haben, die End- 
Kontrollpunkte zu interpolieren. Für kubischen B-Spline-Kurven gilt z.B., 


vgl. (7.24) und (7.26): 


2- 1 


Sk (to) = 380 + zb £ bo (7.28) 
2- l- - 
Snlun) = Zbnt ebnı # bu (7.29) 


Prinzipiell gibt es zwei verschiedene Verfahren, diesen Nachteil zu beheben 
(siehe auch [BG89)): 


1. Man vervielfältigt die End-Kontrollpunkte maximal k — 1 Mal. 


2. Man führt zusätzliche Kontrollpunkte - sogenannte Phantompunkte - ein. 


Dies ist auch der Grund, weswegen wir auf beiden Seiten des Definitionsbe- 
reiches ungenutzte Intervallpunkte eingeführt haben. Diese dienen dazu, die 
vervielfältigten End-Kontrollpunkte bzw. die zusätzlich eingeführten Phantom- 
punkte aufzunehmen. Wir werden sehen, daß wir maximal k — 1 zusätzliche 
Punkte einfügen werden, es ist also genug Platz vorhanden. 


Durch eine (k — 1)-fache Vervielfältigung der End-Kontrollpunkte erreicht 
man, daß die entstehenden B-Spline-Kurven auf jeden Fall durch die End- 
Kontrollpunkte verlaufen. Man führt bei einer (k — 1)-fachen Vervielfältigung 
neue Kontrollpunkte 
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ein und legt die geänderte Parameterzerlegung 0 = u_(-1),°'*Unt+k+k-ı = 1 
zugrunde mit u; = #==1,m=n+k+2(k-1). Die B-Spline-Kurve berechnet 
sich dann als: 


n+k-1 
3.(u) = Y_ b,NF(u + ) für vv <u<u, 
=-k+l 


Daß diese Kurve die End-Kontrollpunkte interpoliert, folgt aus der Eigenschaft 
der B-Spline-Kurven, daß zur Berechnung des Wertes an einer bestimmten Pa- 
rameterposition höchstend k — 1 Kontrollpunkte berücksichtigt werden. Man 
beachte, daß wir den gleichen Definitionsbereich wie in (7.25) verwenden, ob- 
wohl wir jetzt zusätzliche Intervallpunkte eingefügt haben. Der Grund dafür 
liegt darin, daß die zusätzlichen Kontrollpunkte nur dazu dienen, die B-Spline- 
Kurve in der Nähe der ursprünglichen End-Kontrollpunkte das gewünschte 
Aussehen zu geben, die zusätzlichen Kontrollpunkte sollen nicht wie die ur- 
sprünglichen Kontrollpunkte approximiert werden. Dies wird besonders klar 
bei der unten beschriebenen Phantompunkt-Technik. 


Das Verfahren der Vervielfältigung der End-Kontrollpunkte hat den Nach- 
teil, daß dadurch in der entstehenden B-Spline-Kurve Unstetigkeiten auftreten 
können. Dies läßt sich vermeiden, wenn man die End-Kontrollpunkte weni- 
ger als k — 1 Mal vervielfältigt. Dann interpoliert die B-Spline-Kurve zwar 
die End-Kontrollpunkte nicht immer, aber die B-Spline-Kurve nähert sich 
den End-Kontrollpunkte doch sehr stark. Die entstehenden Kurven für den 
Beispiel-Kontrollpunkt-Satz bei Verdoppelung der End-Kontrollpunkte ist für 
die kubischen B-Spline-Kurven in Abbildung 7.8 wiedergegeben. 


Das Einfügen von Phantompunkten hat den Vorteil, daß man auf jeder Seite nur 
einen neuen Kontrollpunkt einfügen muß und daß man das Auftreten von Unste- 
tigkeiten vermeidet. Wir veranschaulichen das Verfahren hier für die kubischen 
B-Spline-Kurven. Gesucht ist ein Punkt b_, mit der Eigenschaft: 


l- 2- l- _ 
Sk(Uo) = 5-1 + 300 + zd = bo 


Dies gilt, wenn 


b_ı = 2b -bı 
Analog fügt man einen Kontrollpunkt Da+i ein mit 


bat = 2b, — b2-ı 


Die kubischen B-Spline-Kurven berechnen sich in diesem Fall zu 
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Abbildung 7.8: Diese Abbildung zeigt Beispiele für das Aussehen von B-Spline-Kurven, 
bei denen die End-Kontrollpunkte verdoppelt wurden. Man sieht, daß die Kurven jetzt 
auch in der Nähe der End-Kontrollpunkte ein gewünschtes Verhalten zeigen, die Kurven 
nähern sich den End-Kontrollpunkte sehr stark an, interpolieren diese aber nicht. 
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Abbildung 7.9: Diese Abbildung zeigt Beispiele für B-Spline-Kurven, bei denen Phan- 
tompunkte verwendet wurden, um die Kurven in der Nähe der End-Kontrollpunkte in die 
gewünschte Form zu bringen. Auch hier haben wir wieder die gleichen Kontrollpunkte 
verwendet wie in den Beispiele für die Bezier-Kurven. Die Phantompunkte sind nicht 
eingezeichnet, weil sie zum Teil wesentlich außerhalb des Zeichenbereiches liegen. Man 
sieht, daß die beiden End-Kontrollpunkte interpoliert werden. Ansonsten unterscheiden 
sich die Kurven nicht sehr wesentlich von denen aus Abbildung 7.8. 
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Abbildung 7.10: Diese Ab- 
bildung zeigt ein Beispiel für 
das Aussehen einer geschlosse- 
nen B-Spline-Kurve, die mit 
dem im Text angegebenen Ver- 
fahren berechnet wurde. 





n+l 
= k . 
3.(u) = EM irk- (ut) für vo <Su<w 
ı1=— 
wobei diesmal die Parameterzerlegung 0 = u_1,"‚unygyı = I mitu = 4, 


m =n+k-+ 2 zugrunde liegt. Auch hier haben wir den gleichen Definitionsbe- 
reich wie in (7.25) verwendet. Beispiele für B-Spline-Kurven unter Verwendung 
von Phantompunkten sind in Abbildung 7.9 wiedergegeben. Eine besondere 
Beachtung verdient die B-Spline-Kurve unten links, die sich von den anderen 
dadurch auszeichnet, daß bo = b,„ ist, d.h. der durch die Kontrollpunkte de- 
finierte Polygonzug ist geschlossen. Hier erreichen wir durch Einführung der 
Phantompunkte zwar, daß die entstehende Kurve auch geschlossen ist, in der 
Nähe des Kontrollpunktes b, = b,„ hat die Kurve aber nicht das gewünschte 
Aussehen: sie hat eine Spitze und ist nicht symmetrisch, wie die symmetrische 
Lage der Kontrollpunkte erwarten läßt. Allgemein läßt sich dieser Defekt behe- 
ben, indem man die Kontrollpunkte in beide Richtungen periodisch fortsetzt. 
Wenn man eine geschlossene B-Spline-Kurve erhalten will, setzt man also: 

b_ı =b nb-2 = u bn-1,° ‘ -,b_(k-ı) = Dn-k 
bDa+1 = bı, Bra = b2- Dn+k-1 = bk-ı 


Dabei verwendet man die gleiche Parameterzerlegung wie bei der (k— 1)-fachen 
Vervielfältigung der Kontrollpunkte. Mit dieser Festsetzung erhält man die in 
Abbildung 7.10 wiedergegebene Kurve. 


B-Spline-Kurven haben ebenso wie die Bezier-Kurven die Eigenschaft, 
vollständig in der konvexen Hülle der Kontrollpunkte zu liegen. Es gilt so- 
gar die stärkere Eigenschaft, daß das zu dem Intervall I = [u.,us4r-ı](0 < 
z <n-(k-1)) gehörende Kurvensegment ganz in der konvexen Hülle der zu- 
gehörigen Kontrollpunkte b,,--- ,dz+x-ı liegt. Zum Beweis dieser Eigenschaft 
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siehe [HL89] oder [GR74]. Weitere Eigenschaften der B-Spline-Kurven, die wir 
ebenfalls nicht beweisen wollen, die wir aber angeben, damit der Leser sich ein 
Bild über das Aussehen von B-Spline-Kurven machen kann (für einen Beweis 


siehe z.B. [HL89], [Far90] oder [QD87]), sind die folgenden: 


e Eine B-Spline-Kurve verläuft üblicherweise dicht in der Nähe des Mittel- 
punkts jeder Kante ihres Kontrollpunkt-Polygons. 


e Wenn k—1 benachbarte Kontrollpunkte kollinear liegen, so berührt die B- 
Spline-Kurve das Kontrollpunkt-Polygon zwischen den kollinearen Kon- 
trollpunkten. 


e Wenn k benachbarte Kontrollpunkte kollinear liegen, so ist das zugehörige 
B-Spline-Kurvensegment eine Gerade. 


e Wenn k-1 Kontrollpunkte zusammenfallen, so kann die B-Spline-Kurve 
eine Spitze besitzen. 


Zusammenfassend ist zu sagen, daß B-Spline-Kurven gegenüber den Bezier- 
Kurven die angenehme Eigenschaft der lokalen Kontrolle haben, d.h. daß zur 
Berechnung eines Kurvenpunktes maximal k Kontrollpunkte berücksichtigt wer- 
den. Für die üblicherweise verwendeten kubischen B-Spline-Kurven sind das 
maximal vier Kontrollpunkte. Dies macht selbst für größere Kontrollpunkt- 
Mengen die Berechnung billig und erleichtert es dem Benutzer, die Auswirkun- 
gen des Verschiebens eines Kontrollpunktes vorherzusehen. Diese Eigenschaf- 
ten haben die B-Spline-Kurven und ihre dreidimensionale Erweiterung, die 
B-Spline-Oberflächen, zu den am weitesten verbreiteten Kurven zur Beschrei- 
bung von gekrümmten Oberflächen werden lassen. 


7.3 Polynomielle Interpolation 


Die bis jetzt betrachteten Kurven haben die Kontrollpunkte approximiert, nicht 
interpoliert. In vielen Situationen ist es aber erforderlich, daß die Kurve wirk- 
lich durch die Kontrollpunkte hindurch verläuft. Wir betrachten wieder eine 
Menge von Kontrollpunkten bo, : :: ,dn, die wir äquidistant auf [0,1] anordnen, 
d.h. Kontrollpunkt b; ist Parameterwert t; = i/n zugeordnet. Gesucht ist eine 
Kurve 5, die die Kontrollpunkte interpoliert, d.h. für die gilt: 


p(t;) = b; für 1<sı<sn 
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Die Verfahren der polynomiellen Interpolation konstruieren 5 - wie der Name 
schon sagt - als Polynom vom Grad n. Polynomielle Interpolation ist ein wohl- 
bekanntes Verfahren der numerischen Analysis. Ausführliche Darstellungen 
können in der einschlägigen Fachliteratur nachgelesen werden. Eine gute Über- 
sicht über die relevanten Verfahren findet man unter anderem in [Sto83] und 
[HL89]. Wir werden hier nur das Verfahren der Lagrangeschen Interpolation 
kurz vorstellen, um die Probleme der polynomiellen Interpolation aufzuzeigen. 
Wir werden uns dabei an die in [Far90] gegebene Motivation anlehnen, um dem 
Leser einen Eindruck der hinter dem Verfahren stehenden Idee zu geben. 


Für zwei Kontrollpunkte 5; und b;}ı mit den zugehörigen Parameterwerten t; 
und £;+1, beschreibt 
-t. t-6 


+ —— 1 I1<i<n-1 
ab ba-t 





_ ti 
lt) = 


die durch b; und b;,, verlaufende Gerade, d.h. das Polynom vom Grad 1, das 
b; und 5;,, interpoliert. Aufbauend auf dieser Formel können wir rekursiv das 
Polynom vom Grad : definieren, das : + 1 Kontrollpunkte interpoliert. Wenn 
wir annehmen, daß wir das Problem für : Kontrollpunkte gelöst haben, dann 
erhalten wir die Lösung für ı +1 wie folgt: Sei ph! das Polynom vom Grad 
i— 1, das bo, -,b;-ı interpoliert und sei 5"! das Polynom vom Gradi -1, 
das h,, ...,b; interpoliert, dann ist 


t; 


it; ı— pin 
t (tt 
;— tg (+ to (£) 
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das Polynom, das bo, :- ‚5; interpoliert. Daß dies gilt, sieht man durch Einset- 
zen der Werte to,‘ -t;: 
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Außerdem gilt für alle Parameterwerte t; mit 1<j<i: 55 (t;)= Pi '(t;) = 
P;. Daraus folgt dann durch Einsetzen auch 5%(t,;) = 5,;. Damit können wir das 
dien+1 Kontrollpunkte interpolierende Polynom wie holgt rekursiv definieren: 
ausgehend von 9° = b; setzen wir 





—-BI,L(t) (7.30) 
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fürl<r<sn,0 <:<n-r. Diese rekursive Formulierung ist auch als 
Aitken’s Algorıthmus bekannt. Das gesuchte Polynom ist 5%. Man ordnet die 
errechneten Polynome häufig in einem Dreieck-Schema ähnlich dem Casteljau- 
Schema an. Im kubischen Fall sieht das Schema z.B. wie folgt aus: 


Sg 3 3 
QOOSODOo=-sO900 
a a 
Sl ul ul Sul 

DD Lug) © 
RR gı 
Dt 
3 
MDIOD 


5 


@& 


Formel (7.30) kann wie folgt geometrisch interpretiert, werden: #!(t) entsteht 
durch Mischen der beiden Polynome 5! _ und #;;;(t), wobei #5 die Kon- 
trollpunkte b;,-- - ,dj+r_ı interpoliert und Pin 1 die Kontrollpunkte b;41,°** ‚Disr. 
Wie man an den Wichtungsfaktoren in (7.30) sieht, hängt das Mischverhältnis 
linear vom Abstand des Parameterwertes t von den beiden Intervalpunkten t; 
und t;+r ab. Wenn t näher bei t; liegt, wird 57”! mehr berücksichtigt, wenn t 
näher bei t;+, liegt, wird 5!,] mehr berücksichtigt. 


Eine alternative Formulierung des interpolierenden Polynoms kann mit Hilfe 
der Lagrangeschen Polynome erfolgen. Diese Formulierung hat den Vorteil, daß 
sie die Kontrollpunkte explizit enthält. Die Lagrangeschen Polynome L” sind 
definiert als 





»-TIc) 


Das die Kontrollpunkte interpolierenden Polynom ist dann 


pt) = > b:L}(t) (7.31) 


i=0 


Daß dieses Polynom die Kontrollpunkte interpoliert folgt aus der Tatsache, daß 
L?"(t;) = ö;,;, wobei 6;,; das sogenannte Kronecker-Symbol ist, das definiert ist 
als: 


5; = | 1 fürı=j 


0 sonst 


D.h. für den Parameterwert t; verschwinden alle Lagrangeschen Polynome außer 
L? und es ist L?(t;) = 1. Daraus folgt auch, daß die Lagrangeschen Polynome 
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L} eine Basis für alle Polynome vom Grad n bilden. Die Eindeutigkeit des 
interpolierenden Polynoms folgt aus der Tatsache, daß es nur ein Polynon vom 
Grad n gibt, das n + 1 Kontrollpunkte interpoliert. (7.31) ist die eindeutige 
Darstellung dieses Polynons mit den Lagrangeschen Polynomen als Basis. Der 
vorher beschriebene Aitken-Algorithmus liefert das gleiche Polynom. 


Die Methode der polynomiellen Interpolation liefert gute Ergebnisse für kleine 
Mengen von Kontrollpunkten. Sobald aber die Menge der Kontrollpunkte 
größer wird, oszillieren die entstehenden Polygone sehr stark und weichen unter 
Umständen erheblich vom erwarteten Aussehen ab (siehe auch Abbildung 7.11). 
Dies ist der Grund dafür, daß polynomiellen Interpolation in der Praxis kaum 
verwendet wird. 


7.4 B-Spline-Interpolation 


In Abschnitt 7.2 haben wir gesehen, wie man B-Spline-Kurven zur Appro- 


ximation einer Menge von Kontrollpunkten bo, ... ‚br verwenden kann. Um 
die B-Spline-Kurven zur Interpolation von bo,'--,b,„ verwenden zu können, 
muß man neue Kontrollpunkte £o,--: ,Z„ einführen, die so zu wählen sind, daß 


bo,‘ ,d interpoliert werden. Dieses Vorgehen ähnelt dem in Abschnitt 7.2.3 
beschriebenen Phantompunkt-Verfahren, nur daß man hier nicht nur zwei, son- 
dern n+1 neue Punkte einführt. Wir werden in diesem Abschnitt bo, , b„ als 
Interpolationspunkte, &£o, ‚Zn als Kontrollpunkte bezeichnen. Wir werden im 
folgenden beschreiben, wie diese Kontrollpunkte zu bestimmen sind. 


Wir nehmen wieder an, daß die Interpolationspunkte äquidistant auf [0,1] ange- 
ordnet sind, d.h. daß b; der Parameterwert u; = i/m mit m = n+ k zugeordnet 


ist. Damit bo, - - ,d„ interpoliert werden, muß gelten: 
b; = 5.(u;) = > 2;N? (u; + LE für 0 <j<n (7.32) 
’ ı=0 nu Zm . 


Dies ist ein System von n + 1 linearen Gleichungen mit n + 1 Unbekannten 
Zo,‘'',Zn, das mit einem gängigen Verfahren (Gauß’sche Elimination oder 
Gauß-Seidel-Iteration) gelöst werden kann. In der Praxis verwendet man häufig 
kubische B-Spline-Kurven, d.h. man wählt k=4. Dann wird (7.32) zu 
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Abbildung 7.11: Diese Abbildung zeigt die Interpolation der Beispiel-Punktmengen 
mit Lagrangescher Interpolation. Für geringe Anzahl von Interpolationspunkten zeigt das 
Verfahren gute Ergebnisse. Wenn die Anzahl der Interpolationspunkte aber größer wird, 
zeigen die interpolierenden Polynome große Ausschläge. Dies sieht man vor allem am 
rechten unteren Beispiel. Wir haben den Teil, der bo interpoliert, gar nicht eingezeichnet, 
weil er über den Seitenrand hinausragen würde. 
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1 2 1 
_ 1 
bo = 22 + 52 (vgl. 7.28) 
_ 1 2 


Dies läßt sich in Matrixform darstellen als Az = b oder ausgeschrieben: 


21090 000 50 bo 
ı 22:0 000 Zı bi 
0:33 4 000 , b, 
0 FE In-1 bn-ı 
0000 0: 2 En b.. 


Wenn man die inverse Matrix A! zu A kennt, lassen sich die unbekannten 
Kontrollpunkte auch direkt durch 2 = A!b berechnen. Da A nicht von den 
Interpolationspunkten abhängt, kann man in einer Implementierung A! vorbe- 
rechnen und erhält dien +1 Kontrollpunkte durch Multiplikation eines Vektors 
(von Punkten) mit einer Matrix. Wenn die neuen Kontrollpunkte &o,::: ,&n be- 
stimmt sind, läßt sich die interpolierende B-Spline-Kurve mit der in Abschnitt 
7.2.3 beschriebenen Formel (7.25) bestimmen: 


5.(u) = 5: NHu4 „) für WLusm (7.33) 


i=0 


Beispiele für mit diesem Verfahren erzeugte B-Spline-Kurven findet man in 
Abbildung 7.12. Man sieht an diesen Beispielen, daß manche der Kurven in 
der Nähe der End-Interpolationspunkte nicht ganz befriedigende Ergebnisse 
zeigen. Dies läßt sich beheben, indem wir zwei zusätzliche Kontrollpunkte Z_ı 
und Z„+ı aufnehmen, die dazu dienen, die entstehenden Kurven in der Nähe 
der End-Interpolationspunkte zu kontrollieren. (7.33) wird dann zu 


| n+l 
| k 
3. (u) = ) 5; NF(u + 57) für Uo < u < Un 


ı=—-1 
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Abbildung 7.12: Diese Abbildung zeigt die Anwendung der B-Spline-Interpolation auf 
die Beispiel-Punktmengen. Die neu errechneten Kontrollpunkte sind nicht eingezeich- 
net. Einige der Kurven zeigen an den End-Interpolationspunkten ein etwas unerwartetes 
Verhalten (siehe die rechten Kurven für die letzten Interpolationspunkte). 


274 KAPITEL 7. GEKRÜMMTE OBERFLÄCHEN 


Eine Möglichkeit der Kontrolle ist es, von den Kurven zu verlangen, daß sie an 
den End-Interpolationspunkten die gleiche Steigung haben wie der durch die 
Interpolationspunkte verlaufende Polygonzug. Seien also to = bi — bo und t, 
b„—b,-ı die vorgegebenen Tangentenvektoren. Für die Ableitung der kubischen 
B-Spline-Kurven erhält man durch direktes Differenzieren von (7.24): 


du 


wobei 














u (%) = mä-ı 7 (0) +m& 200.0) + 
m_ m_ 
= - It „ 
und analog 
ds _m 
(un) = "2 —Ln-ı + 2 dar 


Daraus erhält man dann folgendes Gleichungssystem: 


-2020 .-.0 00 s-ı 
ae ur | 000 &o 
o 13 1 00 ä 
0 00 1 2 1 & 
0000 -2 0 2|| Aı 


_ n+1 k n+li 4 
d3% — 24) _ 2 
._ —q 


mi, (0) 
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Die mit diesem modifizierten Verfahren erzeugten Interpolationskurven sind in 
Abbildung 7.13 wiedergegeben. | 


7.5 Wahl der Parametrisierung 


Wir haben in den vergangenen Abschnitten immer angenommen, daß die Kon- 
trollpunkte äquidistant auf dem zugrundeliegenden Parameterintervall [0,1] an- 
geordnet sind, d.h. daß Kontrollpunkt b; dem Parameterwert t; = i/n zugeord- 
net ist (uniforme Parametrisierung). Das ist zwar die einfachste Zuordnung, 
aber nicht immer die beste, weil sie die geometrische Lage der Kontrollpunkte 
zueinander nicht berücksichtigt. In [Far90] wird als intuitive Erklärung der 
Situation vorgeschlagen, sich den Parameter t als Zeit vorzustellen. Jedem 
Kontrollpunkt b; ist ein Zeitpunkt t; und ein Punkt auf der Kurve 3 (Da- 
tenpunkt) 3; = 3(t;) zugeordnet’. In dem Zeitintervall zwischen to = 0 und 
t„ = 1 wird die Kurve zwischen den Datenpunkten 3, und 3, durchlaufen. 3; 
wird zum Zeitpunkt t; durchlaufen. Bei der uniformen Parametrisierung wird 
dabei der Weg auf der Kurve zwischen benachbarten Datenpunkten in der glei- 
chen Zeit durchlaufen, egal wie weit die Datenpunkte voneinander weg liegen. 
Kurvenstücke zwischen weit voneinander entfernt liegenden benachbarten Da- 
tenpunkten werden also sehr schnell durchlaufen, Kurvenstücke zwischen nahe 
beieinander liegenden benachbarten Datenpunkten sehr langsam. Dies führt 
bei abruptem Wechsel der Entfernung der Datenpunkte voneinander zu unre- 
gelmäßig aussehenden Stellen im Kurvenverlauf, siehe auch Abbildung 7.14. 
Die Begründung liegt darin, daß eine zweifach stetig differenzierbare Kurve 
gezeichnet wird, deren Entstehen man sich mit der folgenden Analogie klar ma- 
chen kann: man kann sich die Kurve als Bahn eines Autos vorstellen, das die 
einzelnen Datenpunkte 3; der Reihe nach abfährt und zwischen benachbarten 
Datenpunkten immer die gleiche Zeit braucht. Wenn die Datenpunkte 3; und 
5;+1 weit voneinander entfernt liegen, muß das Auto die Strecke zwischen ihnen 
sehr schnell zurücklegen. Wenn dann 3;,, sehr nahe bei 3;;1 liegt, muß das Auto 
hinter 5;+1 stark abbremsen, um die Strecke zwischen 3;+1 und 3;+3 langsam zu 
durchfahren. Da das Abbremsen nicht ganz abrupt erfolgen kann, wird das 
Auto etwas über 3;+1 hinausschießen, um dann in Richtung 3;+3 einzulenken. 


Man kann diesen Nachteil durch eine andere Parametrisierung ändern. Die 
naheliegendste Möglichkeit besteht darin, die Parameterwerte t; so zu verteilen, 
daß das Zeitintervall zwischen benachbarten Parameterwerten proportional ist 
zum Abstand der zugehörigen Kontrollpunkte, d.h. daß 


5Bei den Interpolationsverfahren fallen 3; und b; zusammen. 
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Abbildung 7.13: Diese Abbildung zeigt die Anwendung der B-Spline-Interpolation auf 
die Beispiel-Punktmengen. Hier wurden zwei zusätzliche Kontrollpunkte verwendet, die 
nach dem im Text beschriebenen Verfahren bestimmt wurden. Man sieht, daß die Kurven 
jetzt in der Nähe der End-Interpolationspunkte ein besseres Verhalten zeigen als ohne die 


zusätzlichen Punkte. 


7.5. WAHL DER PARAMETRISIERUNG 277 


Abbildung 7.14: Diese Abbildung zeigt 
eine Kontrollpunktmenge, für die die 
Wahl der Parametrisierung einen Unter- 
schied im Aussehen der entstehenden 
Kurven hervorruft. Links oben ist die mit 
der linearen Parametrisierung errechnete 
Kurve wiedergegeben, rechts oben die 
mit der Längenparametrisierung errech- 
nete, links unten die mit der Zentripedal- 
Parametrisierung errechnete. 
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u -t4-, _|5-b-ıl . 
at ah 5, für 1<ı<n 

gilt (Längenparametrisierung, siehe [Eps76], [Far90]). Mit o =0O und, =1 
ergibt sich daraus eine eindeutige Festlegung der Parameterwerte t;. Man be- 
achte, daß wir hier die Kontrollpunkte und nicht die Datenpunkte verwendet 
haben, weil die Lage der Datenpunkte (bei den Approximationsverfahren) von 
der Wahl der Parameterwerte abhängt. Eine andere in der Literatur vorgeschla- 
gene Parametrisierung ist die Zentripedal-Parametrisierung, siehe [Lee89]: 


bb _ 


_ für 1<ı<n 
Gy -t u 





die i.a. zu ”runderen” Kurven führt. Eine noch aufwendigere Parametrisierung 
ist die Foley-Parametrisierung, siehe [NF89]: 


_ 3 Od 3 Od 
hard ( at" Did t dan 


mit d; = |b; - b,_ı| und 6; = min( — ©;,5), wobei ©; der von b;_1, bi, Birı 
gebildete Winkel ist. 

Wir sollten noch darauf hinweisen, daß alle diese Parametrisierungen Heuristi- 
ken sind und daß zu verschiedenen Kontrollpunkt-Mengen mal die eine, mal die 
andere Heuristik gute Ergebnisse zeigt. In den meisten Fällen reicht die einfa- 
che uniforme Parametrisierung aus (die meisten Abbildungen in diesem Kapitel 
wurden mit uniformer Parametrisierung gezeichnet). In kritischen Fällen ist 
die Längenparametrisierung oder die Zentripedal-Parametrisierung ein guter 
Kompromiß zwischen Aufwand und Resultat. 


7.6 Bezier-Oberflächen 


Man kann sich eine gekrümmte Oberfläche dadurch entstanden denken, daß 
man eine Kurve durch den Raum bewegt, deren Aussehen sich während der 
Bewegung ändern kann. Wir nehmen in diesem Abschnitt an, daß die sich 
bewegende Kurve eine Bezier-Kurve vom Grad m ist, d.h. sie wird durch m +1 
Kontrollpunkte bo,‘ ‚dm gesteuert. Wenn die Kurve sich durch den Raum 
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bewegt, müssen die Kontrollpunkte sich ebenfalls durch den Raum bewegen. 
Eine Bezier-Oberfläche entsteht, wenn die Kontrollpunkte sich ebenfalls auf 
Bezier-Kurven bewegen, wobei wir annehmen, daß alle Kontrollpunkte sich 
auf Bezier-Kurven gleichen Grades n bewegen. Mathematisch läßt sich die 
entstehende Oberfläche als Tensor-Produkt beschreiben. Die sich bewegende 
Bezier-Kurve sei 


b”(u) = Y, bB(u) füro<u<i 


s=0 


Jeder Bezier-Punkt b; durchläuft eine Bezier-Kurve vom Grad n, d.h. es ist 


\ 
2" 


= 5270) für0<v<1 


wobei bjo,‘'-,din die Kontrollpunkte für diese Bezier-Kurve sind. Einsetzen 
liefert als Gleichung für einen Punkt auf der Bezier-Oberfläche 


Drr(uv)=),) 55BP(u)Biw) füro<uv<i (7.35) 


i=0 7=0 


Die (n+1)(m+1) Kontrollpunkte b;; spannen ein Netz auf, in dem für0 <i< m, 
0<j<n b;; mit seinen Nachbarpunkten b;_ı ö birnsı b; j-l b; ‚;+ verbunden ist. 
Die Randpunkte bo; bzw. bj sind mit bo j-ı und bo ‚;+ı bzw. b m,j-ı und b.. +1 
verbunden, die Randpunkte b;o bzw. b;. sind mit b;_ı ‚ound bir, o bzw. b_ın und 
b;+1,n verbunden, vgl. Abbildung 7.15. Kontrollpunkt b;; ist der zweidimensio- 
nale Parameterpunkt (u;,v;) zugeordnet mit u; = i/m und v; = j/n. Wenn 
man den Parameterwert v = V.onst konstant hält, erhält man einen Schnitt 
(auch Parameterlinie genannt) durch die Bezier-Oberfläche, der wieder eine 
Bezier-Kurve ist. Die Kontrollpunkte dieser Bezier-Kurve sind 


b;(Vconst) = > 5;B}(veonst) für 0 sı<m 


Da diese Punkte auf Bezier-Kurven liegen, lassen sie sich natürlich auch mit 
Hilfe des Casteljau-Algorithmus berechnen. Ausgehend von diesen Kontroll- 
punkten kann man die Punkte auf der Schnittkurve ebenfalls mit Hilfe des des 
Casteljau-Algorithmus berechnen, diesmal auf den Parameterwert u angewen- 
det. Analoges gilt für konstantes u = Uconst- 
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_ - Abbildung 7.15: Die Kontroll- 

boo bon punkte b;; spannen ein Netz auf, das 
hier vereinfacht zweidimensional wie- 
dergegeben ist. 


b 0 Dmn 

Die meisten Eigenschaften der Bezier-Kurven lassen sich einfach auf die Bezier- 
Oberflächen übertragen. Da der (zweistufige) Casteljau-Algorithmus zur Be- 
rechnung von Punkten auf der Bezier-Oberfläche verwendet werden kann, haben 
Bezier-Oberflächen die Eigenschaft, vollständig in der konvexen Hülle der Kon- 
trollpunkte zu liegen. Ebenso wie Bezier-Kurven sind Bezier-Oberflächen auch 
affın invariant. Durch Einsetzen von (u,v) = (uo, vo), (Um, vo), (Uo, Un), (Um, On) 
sieht man, daß die Bezier-Oberfläche die Randpunkte boo, don, Dmo, Dmn interpo- 
liert. Zur Berechnung der Tangentenebenen an die Bezier-Oberfläche muß man 
die partiellen Ableitungen der Bezier-Oberfläche bestimmen. Für diese erhält 
man aus den Ableitungen für Bezier-Kurven 


m- n 


Ö _ Fu _ 

za) = m) 2 (is 5u)B”'(u)B}o) 
i=0 j=0 

3 - m n-1 _ _ 

EAN v) = n)_ bist — b;)Bi"(u)B}"(v) 
ı=0 5j=0 


Dies sind die Tangentenvektoren der v- bzw. u-Parameterlinien, die die Tan- 
gentenebene in einem bestimmten Punkt der Bezier-Oberfläche aufspannen, 
vgl. Abbildung 7.16. Den Normalenvektor für einen Punkt (u,v) der Bezier- 
Oberfläche erhält man als 


n(u,v) = I many) X I zmny v) 


u Ov 
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— Abbildung 7.16: Die Tangentenvek- 
toren Ob/öu und Öb/dv sind Tan- 
gentenvektoren an die u- bzw. v- 
Parameterlinien, die in Richtung 
wachsender u- bzw. v-Werte zeigen. 





Durch Einsetzen von (u,v) = (uo, do), (Um, vo), (Uo, Un), (Um, Un) sieht man, daß 
die Tangentenebenen für die Randpunkte vollständig durch die Nachbarpunkte 
bestimmt sind. Es gilt: 


r(uo, vo) = (bio — boo) x (boı — boo) 
lum,vo) = (dmo — bm-1,0) X (dmı — dmo) 
r(uo, Un) = (Bor u bon-ı) x (bin u bon) 
(Um, on) = (byan _ Dm-in) x (bian — dmn-ı) 


Das Tensorprodukt (7.35) läßt sich auch in Matrixform darstellen als 


boo ** don Bs(v) 
mu, 0) = [BP(u) Bw] | : ! 
bo °** Ömn B*(u) 


Diese Darstellung ist vor allem für diein den folgenden Abschnitten berechneten 
B-Spline-Oberflächen von praktischem Nutzen. 


Bezier-Oberflächen haben die gleichen Nachteile wie die Bezier-Kurven: zur 
Berechnung eines Punktes der Oberfläche werden alle Kontrollpunkte berück- 
sichtigt. Dies macht die Berechung aufwendig und führt dazu, daß lokale Ei- 
genschaften der Kontrollpunkte u.U. wenig berücksichtigt werden. Aus diesem 
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Abbildung 7.17: Diese Abbildung zeigt zwei Beispiele für das Aussehen von Bezier- 
Oberflächen. Das Kontrollpunkt-Netz ist gestrichelt eingezeichnet. Die Oberflächen 
werden durch einige u- bzw. v-Parameterlinien dargestellt, die durch Geradenstücke an- 
genähert werden. Die verdeckten Teile der Oberflächen sind gepunktet dargestellt. Man 
sieht, daß die Oberfläche die Eck-Kontrollpunkte interpoliert und vollständig in dem von 
den Kontrollpunkten definierten Polygon liegt. Die Berücksichtigung aller Kontrollpunkte 
zur Berechnung eines Oberflächenpunktes bewirkt, daß die Oberflächen u.U. relativ weit 
von den Kontrollpunkten entfernt verlaufen und daß die Oberflächen sehr glatt wirken. 
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Grund sind Bezier-Oberflächen in der Praxis nur für kleinere Kontrollpunkt- 
Mengen gut einsetzbar. Auf der anderen Seite sind Bezier-Oberflächen ge- 
rade wegen der Berücksichtigung aller Kontrollpunkte ziemlich glatt und aus- 
geglichen (siehe auch Abbildung 7.17), eine Eigenschaft, die die im nächsten 
Abschnitt beschriebenen B-Spline-Oberflächen nicht unbedingt haben. Dies 
macht sie in manchen Anwendungsgebieten gut einsetzber (z.B. in der Fahrzeu- 
gindustrie, wo sie ja auch entwickelt wurden). Den Nachteil der aufwendigen 
Berechnung für größere Kontrollpunkt-Mengen kann man durch Verwendung 
von zusammengesetzten Bezier-Oberflächen beheben, bei denen die Gesamt- 
Oberfläche aus mehreren Einzel-Bezier-Oberflächen zusammengesetzt wird, die 
nach bestimmten Anschlußbedingungen aneinander angeschlossen werden. Wir 
gehen hier nicht weiter auf die Behandlung ein und verweisen den Leser auf 


[HL89] oder [QD37]. 


7.7. B-Spline-Oberflächen 


B-Spline-Oberflächen kann man sich analog den Bezier-Oberflächen entstan- 
den denken. Mathematisch werden sie ebenfalls durch ein Tensorprodukt be- 
schrieben, nur daß anstatt der Bernstein-Polynome die B-Spline-Funktionen 
verwendet werden. Man erhält als Verallgemeinerung von (7.25) 


mn. k N 
Srı(u, v) = >, >, b; NE (u + 3, )Ni® + 2) (7.36) 


i=0 5j=0 


für vo <u< u, und vo <v < v„, wobei die B-Spline-Funktionen der Ordnung 
k und ! verwendet werden. Es ist ce =m+k,y=n+I. Jedem Kontroll- 
punkt b;; ist zweidimensionaler Parameterpunkt (u;,v;) zugeordnet, wobei wir 
wieder eine uniforme Zerlegung annehmen, d.h. es ist u; = ı/z und v; = j/y. 
Auch hier übertragen sich die Eigenschaften der B-Spline-Kurven auf die B- 
Spline-Oberflächen. Ebenso wie die Bezier-Oberflächen liegen die B-Spline- 
Oberflächen vollständig in der konvexen Hülle ihrer Kontrollpunkte. Von den 
B-Spline-Kurven überträgt sich die wichtige Eigenschaft der lokalen Kontrolle 
auf die B-Spline-Oberflächen: zur Berechnung eines Punktes der Oberfläche 
werden maximal k - ! Kontrollpunkte berücksichtigt. Deswegen ist die Be- 
rechnung der B-Spline-Oberflächen weniger aufwendig als die Berechnung der 
Bezier-Oberflächen. Für die partiellen Ableitungen der B-Spline-Oberflächen 
ergibt sich analog zu (7.27): 
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Abbildung 7.18: Veranschaulichung der berück- 
sichtigten Kontrollpunkte zur Berechnung eines 
Oberflächenpunktes 3(u,v). Die Kontrollpunkte 
sind durch ihre zugehörigen Parameterpunkte 
repräsentiert. (u,v) liege im Gebiet Du, = I, X 





b 


a 

I; = [ta : Yarı] X [va : varıl. Es werden 
die 16 Kontrollpunkte b;; berücksichtigt, für die 
a-1l<t<a+t2unddb-1<j<b+r2gilt. 

I zum v) = (k-]) L% vi — dry ——— N; (u +5 SN!o+ En 

u ’ 1 j=0 Ui+rk-1 — Ui ’ 2y 

d Ib; -b;;- k l 

—3,(u,v0) = (I-]) ER, "Ni(u+5 N; '(w+7 

Zöulu) N +) 


Zur Vereinfachung der Darstellung werden wir unsere Aufmerksamkeit im fol- 
genden auf den in der Praxis relevanten bikubischen Fall beschränken, d.h. wir 


wählen k=1=4. In diesem Fall vereinfacht sich (7.36) zu 


nn 


s(u,v) -VYiniu+? 2 N! + ) (7.37) 


ı=0 j=0 


für vo Su < u, undvo Sv<wmtze=m+t4undy=n+4 oder als 
Matrix-Darstellung: 


9 9 boo +++ Bon No(@+ ,) 
s(wv)= |No(u+_)  Nmtu+t—)| |: | | 
bimo . Dan N+(v + .) 


Zur Berechnung eines Punktes 3(u, v) der Oberfläche werden maximal k-! = 16 
Kontrollpunkte berücksichtigt, nämlich genau die, deren zugehörige Parame- 
terpunkte zu (u,v) am nächsten liegen, vgl. Abbildung 7.18. Wenn (u,v) 
mit einem zu einem Kontrollpunkt gehörenden Parameterpunkt (u,,v;) zusam- 
menfällt (und k und ! gerade sind), werden dagegen nur (k- 1)(l-1) = 9 
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Kontrollpunkte zur Berechnung herangezogen, nämlich genau die b;;, für die 
a—-—1l<t<sa+lundb-1<yj<b+l1 gilt Beide Behauptungen ergeben sich 
direkt aus Abschnitt 7.2.3. Analog zu der dort dargestellten Berechnung ergibt 
sich hier für den Grad der Berücksichtigung: 


b.-15-1 be_1,5 ba-1,41 R 
_ 1 21 _ u - Q 
3(Ua, v3) = 6 3 6 bu-1 ba, bu,5+1 3 
barıs-ı ba+ı, ba+1,b+1 5 
1 .,- _ _ _ 
= 35 (ba-1,-1 + ba-1,5+1 + Ba+ı,s-ı + darı,dıı) + 
1 .- _ _ _ 
5 (ba-1,5, + bap-ı + dapzı + darı,) + 
4 _ 
5 be (7.38) 


Das bedeutet, daß b,, mit 4/9 gewichtet wird, die unmittelbar benachbar- 
ten Netzpunkte mit 1/9, die vier restlichen Netzpunkte mit 1/36. Beispiele 
für B-Spline-Oberflächen sind in Abbildung 7.19 wiedergegeben. Man sieht, 
daß die B-Spline-Oberflächen ebenso wie die B-Spline-Kurven nicht die an- 
genehme Eigenschaft haben, die Rand-Kontrollpunkte zu interpolieren. Statt 
dessen erscheinen die entstehenden Oberflächen in der Nähe des Randes ver- 
bogen, für kleinere Kontrollpunkt-Mengen (wie in Abbildung 7.19) sind die 
B-Spline-Oberflächen nicht gut einsetzbar. Diesen Nachteil kann man wie bei 
den B-Spline-Kurven durch das Einfügen zusätzlicher Rand-Kontrollpunkte 
beheben. Eine Möglichkeit besteht darin, die Rand-Kontrollpunkte einfach zu 
vervielfältigen. Wie wir im Abschnitt über die B-Spline-Kurven gesehen haben, 
reicht es im kubischen Fall meistens aus, die Rand-Kontrollpunkte zu verdop- 
peln, d.h. man fügt 2(n +1+m +1) + 4 zusätzliche Randpunkte ein, die das 
Kontrollpunkt-Netz vollständig umgeben. Das Netz der Kontrollpunkte sieht 
damit wie folgt aus: 


b_1,-ı b_10 ._ bin b_1,n+1 
_ er TI TL N _ 
bo,-1 | boo bon. Ä bo,n+1 
| | 
| | 
_ ı _ _ | _ 
bm,-1 \ mo DE b mn Omn+i 
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wobei 
bi. bio 0 < ; < m _ b_ı,; = bo; 0 <j < n 
Din+1 = bin bm+1 3 7 Dim; 


gesetzt wird. Die B-Spline-Oberfläche wird dann durch 


m+1 r+l 
3(u,v) = >, Y, b;N?(u+ SNK“ + ) U <SUS Um,vto SU< vo, 


i=-13j=—1 


berechnet, wobei wir analog zu Abschnitt 7.2.3 eine um zwei Intervallpunkte 
erweiterte Parameterzerlegung in jeder Dimension verwenden, d.h. es ist u; = 
Hl, vj= zu mitze=m+6undy=n+6. Es fehlt noch die Festlegung der 
neuen Eckpunkte des Kontrollpunkt-Netzes b_,.-ı, b_int+ı; bm+1,-1; Dmtinti- 
Diese können so festgelegt werden, daß die B-Spline-Oberfläche die Eckpunkte 
des ursprünglichen Kontrollpunkt-Netzes boo, bon, Dmo, Dmn interpoliert. Dazu 
muß gelten 


3(uo, vo) — bo S(Um,do) = bo S(Uo,U%n) = Bon S(Um,Un) = Dmmn 


Wegen (7.38) gilt z.B. 


1 .- _ _ _ 
36 (b_1.-ı +5-11+2d1,-1ı + bu) + 


S(Uo, vo) 
la Ih abeahngtr 
5 (b_1,0 + do,-ı + doı + bio) + 9 boo 
1 _ . _ _ 
= 36 (b_1.-ı + boı + bio + bıı) + 


l- 2 7.7 4 - 
9 (boo + doo + doı + dio) + 9 boo 
Wenn 3(uo, vo) = doo sein soll, muß gelten 


b_1\-ı = 12 bo 5b -5 bio — bıı 


und analog 
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Abbildung 7.19: Diese Abbildung zeigt die B-Spline-Oberflächen für die Kontrollpunkt- 
menge, die für die Bezier-Oberflächen in der vorangehenden Abbildung verwendet wurden. 
Man sieht, daß keiner der Kontrollpunkte interpoliert wird. Die dargestellten B-Spline- 
Oberflächen zeigen in der Nähe des Randes des Kontrollpunktnetzes ein sehr unschönes 
Aussehen. Dies fällt in diesen Beispielen besonders gut auf, weil das Kontrollpunkt- 
netz sehr klein ist. Nur in Innern haben die entstehenden Oberflächen das gewünschte 
Aussehen. 
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b_in+ı = 12 don —5 bon-ı — 5 bin — bin-ı 
Dr+i,-ı = 22 b,mo —9 bm-1,0 —5 Damı _ bm-iı 


12 Dan —d Dm-im —9d dmm-ı — Dm-in-ı 


bm+i ‚n+1 


Die Verdoppelung der Rand-Kontrollpunkte in der gerade beschriebenen Weise 
führt nur dazu, daß die Eck-Kontrollpunkte interpoliert werden. Den ande- 
ren Rand-Kontrollpunkten nähert sich die B-Spline-Oberfläche zwar stark an, 
interpoliert sie aber nicht, vgl. Abbildung 7.20. Eine Interpolation aller Rand- 
Kontrollpunkte erreicht man wie bei den B-Spline-Kurven duch Einführung von 
2(n +1-+m + 1) +4 Phantompunkten, die ebenfalls das Kontrollpunkt-Netz 
vollständig umgeben. Die Phantompunkte werden durch Lösung eines linearen 
Gleichungssystems bestimmt, das durch die folgenden Forderungen entsteht: 


s(u;, vo) 


© 0<i<sm s(uo,v;) = bo; 0<j<n (7.39) 
s(u,%) = = 


mj 


Sl Sl 


5 
“ 
Fa 
e 

3 
SG 

> 

Du 
| 


wobei z.B. die Forderung 3(u;, vo) = bio bedeutet, daß 


1 _ _ _ _ 
bo = 36 (b-1-1 + b-11 + bir, -ı + dan.) + 


l - _ 20% A_ 
5 (10 + b,-1 + ba + birno) + 5 bo 


gelten muß, was zu den n+1 Gleichungen 


l- l- 1 - 
bat bit bun- 
5_ _ _ _ 


50 — Si — dan, _ gi-10 — din _ 9di+1,0 
führt. Die anderen Forderungen liefern ähnliche Gleichungen. Man beachte, 
daß wir in den rechten Gleichungen die Grenzen 5 = 0 und j = n ausgelassen 
haben, weil die gleichen Forderungen schon von den linken Gleichungen für : = 0 
bzw. : = m abgedeckt werden. (7.39) liefert 2(n + m) Gleichungen für 2(n + 
1+m +1) +4 Phantompunkte, es fehlen also noch 8 Gleichungen. Diese erhält 
man z.B. durch die Forderung, daß die Steigung der B-Spline-Oberfläche in 
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Abbildung 7.20: Diese Abbildung zeigt die für die gleiche Kontrollpunktmenge wie 
in den letzten Abbildungen entstehenden B-Spline-Oberflächen, wenn man die Rand- 
Kontrollpunkte nach dem im Text beschriebenen Verfahren verdoppelt. Die Oberflächen 
haben jetzt auch in der Nähe der Rand-Kontrollpunkte in etwa das gewünschte Aussehen. 
Wie im Text beschrieben, werden die Eck-Kontrollpunkte interpoliert. Beim Vergleich 
mit den Bezier-Oberflächen sieht man, daß die B-Spline-Oberflächen näher an dem 
Kontrollpunkt-Netz liegen, aber ein etwas unregelmäßigeres Aussehen haben. Dies liegt 
an der im Text beschriebenen Eigenschaft der lokalen Kontrolle. 
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5: (Uo, vo) (un, Un) 


u | / 
: 5 (un, vo) : 53 (Yo, Un) 
93 


_ (Um, vo) - (Um; Un) 


Abbildung 7.21: Veranschaulichung der festgelegten Richtungsvektoren zur Berechnung 
der Phantompunkte. 


den Eck-Kontrollpunkten bestimmte Eigenschaften hat. Wir legen fest, daß die 
Richtungsvektoren der u-Ableitungen und der v-Ableitungen für die Eckpunkte 
in dem Kontrollpunkt-Netz liegen, d.h. daß gilt: 








ö 2007 ö = _% 
Em vo) = m(bio — boo) 5, (v0, vo) = n(bor — doo) 
ö z ö 2. 

5 (um»00) = M(m-10— Imo) 5 (Um»v0) = "dm — Bmo) 
ö 2007 ö 7 , 
5, (40, Un) = m(bın — bon) =. (to, Un) = n(bo,n-ı — don) 

un, Un) = m(bm-in — bmn) BRATR Un) = N (dm,n-ı u bran) 
du Ov 

Siehe auch Abbildung 7.21. Wegen 
ds mtl nt 
7," d) [ = ), 1%] SUN + ) 
t=-13j=-1 


6Den Faktor m bzw. n verwenden wir, weil die partiellen Ableitungen diesen Faktor 
enthalten. 
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ergibt sich für den Richtungsvektor an einem zu einem Kontrollpunkt gehören- 
den Parameterpunkt 











Eu) = [te Ye) Ger) 
ba-1,-1 Öda-ı5 Öda-ı,b+1 N} 1(2) 
bap-ı dab  basprı N?%(2) (7.40) 
ba+ı,d-ı Dat+ı, Datı,dtı N5+1(2) 


was wegen (7.34) und (7.24) zu 


95 N N b. b-1 ba-1,b b._1,541 r 
3 _ _ _ 
2, (Ha ©) = m 1-5 0 ; Dan-ı Da Dar 2 
ba+1,b-1 ba+1,b ba+1,b+1 r 
1 - l- 1 - 
= m (nein _ ba-14 — 15 e-1,b+1 
1 - 1- 1- 
+ 2da+1p-1 + bat + deren) 
wird. Analog erhält man 
b.-18-1 bo-1,5 b.-141 -ı 
03 1 21 _ _ _ 
5, Ya» ©) ne 395 bap-ı Dan  bas-ıı 0 
barıd-i Doris ber b+1 n 
1 - 1 - 1- 
_ - —b,-19-1 + <b.- — -dub- 
n( 19 %0-15-1 + 19 e-1,b41 7 2 0a,b-1 
1- 1 - 1 
+zbarı = 12 —Barıb- ıt+ der) 
Die Forderung 82 (Un, vo) = m(bio _ boo) wird damit zur Gleichung 
1 - l- l - 1 - 2 - l - 
70-1, -ı + 35-10 + —b_1ı - —bı,_ = bo -— 310 + —bı 


12 12 12 12 
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Für die anderen Forderungen ergeben sich ähnliche Gleichungen. Abbildung 
7.22 zeigt die mit diesem Verfahren entstehenden Oberflächen. Man sieht, daß 
jetzt alle Rand-Kontrollpunkte interpoliert werden. Wenn man die Oberflächen 
aus Abbildung 7.22 mit den Bezier-Oberflächen aus Abbildung 7.17 vergleicht, 
so sieht man, daß die Bezier-OÖberflächen wesentlich glatter als die B-Spline- 
Oberflächen erscheinen, daß die B-Spline-Oberflächen aber eher in der Nähe 
des Kontrollpunkt-Netzes verlaufen. Je nach Einsatzgebiet ist das eine oder 
das andere erwünscht. 


Ebenso wie es geschlossene B-Spline-Kurven gibt, gibt es auch geschlossene 
B-Spline-Oberflächen, deren Entstehen man sich so vorstellen kann, daß eine 
geschlossene B-Spline-Kurven durch den Raum bewegt wird. Ebenso wie für 
die geschlossenen B-Spline-Kurven muß man für die geschlossenen B-Spline- 
Oberflächen die entsprechenden Rand-Kontrollpunkte periodisch fortsetzen, 
um das gewünschte Aussehen zu erhalten. Man verwendet also das folgende 
Kontrollpunkt-Netz für kubische B-Spline-Oberflächen, die bzgl. Parameter v 
geschlossen sind: 


b_1,0 b_1,0 b_1,0 b_1,0 [ir b_1n b_1n b_1n b_1,n 
_ _ _ zero rn. 0r.—_nn _ _ _ 
boo boo boo boo [ bon. | bon bon bon 
| | 
I | 
| | 
bo bo bo bo Dmn ) Dmmn Dan Dan 
_ _ _ L_--- - - - - - - _- J _ _ _ 
bm+1,0 bm+1,0 Dm+1,0 bm+1,0 a Dm+i,n Dm+i,n Dm+i,n bmti,n 


Dabei können die Kontrollpunkte b_, ; und Dm+i,j mit 0 < j <n wieder als 
Phantompunkte wie beschrieben bestimmt werden. 


7.8 Interpolation mit B-Spline-Oberflächen 


Ebenso wie B-Spline-Kurven zur Interpolation von Kontrollpunkten bo,:-: ‚by 
verwendet werden können, können ganz analog B-Spline-Oberflächen zur In- 
terpolation von Kontrollpunkten 5, 0 <i<m,0<j<.n, verwendet werden. 
Dazu müssen wir neue Kontrollpunkte 2,0 <? <m,0 <j<.n, berechnen, 
die so zu wählen sind, daß die Punkte b;; interpoliert werden. Es muß also 
gelten: 


mn 


_ 2 
bu = 5(ux, vı) vi) =) > Z;N "(ur + — NK + „} (7.41) 


ı=0 j=0 
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Abbildung 7.22: Diese Abbildung zeigt die mit dem Phantompunkt-Verfahren erzeug- 
ten B-Spline-Oberflächen für unsere Kontrollpunktmenge. Man sieht, daß jetzt alle 
Rand-Kontrollpunkte interpoliert werden und daß die Kontrollpunkt-Polygone an den 
Eck-Kontrollpunkten tangential zu der entstehenden Oberfläche liegen. Die in der un- 
teren Oberfläche enthaltenen Spitzen rühren daher, dann die Parameterlinien durch Ge- 
radensegmente angenähert wurden. Bei einer exakten Darstellung würden diese Spitzen 
nicht auftreten. 
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für0O<k<mundO<I<n. Dies ist ein System von (m+1)(n+1) Gleichun- 
gen mit ebensoviel Unbekannten, das mit einem gängigen Verfahren (Gaußsche 
Elimination oder Gauß-Seidel-Iteration) gelöst werden kann. Analog (7.38) 
wird (7.41) zu: 


bu = r (Er-11-ı + Er-ı, 141 + Errı-ı + Errırı) + 
1,_ _ - _ 4 _ 
9 (Ex-ı7 + Zrı-ı + drırı + Zrrı,.) + 9 Tr, 
1_ 1_ 1 _ 1_ 4 _ 1- 
= zen + gTk-1, + 3 Tk-1141 + kl + 9 Er + 9 %,I+1 + 
1 


B 1_ 1 _ 
— ı+-2 — LI 
36 Ik+1,j-ı 3 gt + 36 k+1,i+1 


Auch hier ist es ebenso wie bei der Interpolation mit B-Spline-Kurven not- 
wendig, die Steigung der Oberfläche in der Nähe der End-Interpolationspunkte 
zu kontrollieren, um der entstehenden Oberfläche am Rand das gewünschte 
Aussehen zu geben. Dies erreicht man durch Einfügen von zusätzlichen Rand- 
Kontrollpunkten &_1,;, Em+15, £i-ı und Zinrı für 0 Se <mundO <j<n. 
Insgesamt sind also (m + 3)(rn + 3) — 4 Kontrollpunkte zu bestimmen, für 
die wir bis jetzt (m + 1)(n + 1) Gleichungen festgelegt haben. Die restli- 
chen 2(m + 1) + 2(n + 1) Gleichungen erhalten wir dadurch, daß wir den 
Gradienten der entstehenden Oberfläche für jeden der ursprünglichen Rand- 
Kontrollpunkte festlegen. Dabei legen wir für Rand-Kontrollpunkte, die nicht 
Eck-Kontrollpunkte sind, den Gradienten fest, der ins Innere der Oberfläche 
zeigt. Nur für die Eck-Kontrollpunkte werden beide Gradienten festgelegt, 
vgl. Abbildung 7.23. Wir setzen also fest, daß 


3, (Wir vo) = n(&ı-%;o) D<i<m 


7, Un) = n(Zin-ı — Ein) 


7, 0) = mins) g<jen 


7, (Um, dj) = MlEm-1; Ems) 
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Abbildung 7.23: Veranschaulichung der festgelegten Gradienten: für die Rand- 
Kontrollpunkte &;o und ä;n, (1 < i < m) wird der v-Gradient, für die Rand- 
Kontrollpunkte &o,; und äm,;, (1 < j < m) wird der u-Gradient festgelegt. Nur für 
die Eck-Kontrollpunkte werden beide Gradienten festgelegt. 
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Analog zu (7.40) erhalten wir z.B. für die erste Forderung dien +1 Gleichungen 


= = = 1 
121 Ti-1,-1 Ti-10 T-11 u; 
al; z : %-ı %o Zu 0 = n(2iı- 8,0) 
1 
2 


Zirı,-ı Tirıo Tirri 


oder 


ran an rar 0 
Tg rihe1 TU Yan 3 i,—1 i,0 3 i,1 12 i+1,—1 12 i+11 7 


Für die anderen Forderungen ergeben sich ähnliche Gleichungen. 


7.9 Zeichnen von Oberflächen 


Die in den letzten Abschnitten dargestellten Verfahren zur mathematischen Be- 
schreibung von gekrümmten Oberflächen werden üblicherweise verwendet, um 
Objekten ein realistisches Aussehen zu geben. Die Oberflächen erhalten übli- 
cherweise eine Farbe und werden mit einem der in Kapitel 6 beschriebenen Be- 
leuchtungsverfahren (Gouraud- oder Phong-Methode) dargestellt, sie können 
aber auch als Eingabe für das Ray-Tracing-Verfahren oder das Radiosity- 
Verfahren verwendet werden, siehe Kapitel 8 und 9. Eine einfache Veran- 
schaulichung der beschriebenen Oberflächen erreicht man durch das Zeichnen 
äquidistanter Parameterlinien, die mit Hilfe eines der in Kapitel 3 beschriebe- 
nen Projektionsverfahren auf den Bildschirm oder die Zeichenebene projiziert 
werden. 


Für sich teilweise selbst verdeckende Oberflächen kann man das Aussehen der 
mit diesem Verfahren dargestellten Oberflächen verbessern, indem man zusätz- 
lich ein Verfahren zur Eliminierung verborgener Oberflächen anwendet, vgl. Ka- 
pitel 4. Um den nicht unerheblichen Aufwand eines allgemeinen Verfahrens zu 
verringern, kann man hier auch ein recht einfaches Verfahren anwenden, das 
y-Puffer-Verfahren, im Englischen als floating-horizon-Verfahren bezeichnet, 
vgl. auch [BG89]. Dieses Verfahren eliminiert zwar nicht unter allen Bedin- 
gungen die verborgenen Teile der dargestellten Oberflächen korrekt, liefert aber 
in den meisten Fällen hinreichend gute Ergebnisse. Alle in diesem Kapitel 
dargestellten Oberflächen wurden mit diesem Verfahren erzeugt. 
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Das y-Puffer-Verfahren macht generell die Annahme, daß von zwei Punkten der 
darzustellenden Oberfläche derjenige näher zum Betrachter liegt, der einen ge- 
ringeren z-Wert hat. Man nimmt also an, daß der Betrachter in Richtung 
z-Achse schaut, wenn er die Projektionsebene betrachtet. Diese Annahme 
stimmt überein mit der in Kapitel 3 beschriebenen Situation, bei der unter Ver- 
wendung eines linkshändigen Koordinatensystems die Projektionsebene parallel 
zur (zy)-Ebene liegt und die z-Achse an Stelle d > 0 schneidet, während das 
Projektionszentrum im Ursprung liegt. 


Das Verfahren stellt die Parameterlinien segmentweise dar, wobei die Segmente 
einer u-Parameterlinie durch die Schnittpunkte mit den v-Parameterlinien defi- 
niert sind und umgekehrt. Das Verfahren versucht, die Segmente der Parameter- 
linien in der Reihenfolge zunehmender z-Koordinaten zu zeichnen, wobei aber 
nur die sichtbaren Teile der Segmente dargestellt werden. Welche Teile sichtbar 
sind, bestimmt das Verfahren mit Hilfe zweier Puffer max_y und min_y, die zu je- 
der z-Pixel-Position angeben, welches der maximale bzw. minimale y-Wert ist, 
der für diese x-Position von der Oberfläche bereits gezeichnet wurde. Von einem 
Parameterlinien-Segment wird immer nur der Teil dargestellt, der nicht in dem 
von den beiden Puffern angegebenen Bereich liegt. Dazu wird für jedes Pixel 
(z,y) des zu zeichnenden Parameterlinien-Segmentes y mit den Puffereinträgen 
für x verglichen. Das Pixel (z,y) wird nur dann gesetzt, wenn y < min_ylz] 
oder y > max_y[z]. Für jedes gesetzte Pixel werden die beiden Puffer entspre- 
chend aktualisiert. Dieses Verfahren erzeugt immer dann richtige Ergebnisse, 
wenn die Parameterlinien-Segmente wirklich in der Reihenfolge steigender z- 
Koordinatenwerte dargestellt werden, d.h. wenn die Parameterlinien-Segmente, 
die näher zum Beobachter liegen, zuerst gezeichnet werden. In Abbildung 7.24 
ist wiedergegeben, in welcher Reihenfolge dazu die Parameterlinien-Segmente 
gezeichnet werden. Abbildung 7.25 zeigt eine Programmskizze des Algorithmus. 
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Abbildung 7.24: Diese Abbildung veranschaulicht den beschriebenen Algorithmus zum 
Zeichnen von Oberflächen dadurch, daß vier Momentaufnahmen des Zeichenprozesses 
dargestellt werden. Oben links ist der Zustand nach dem Zeichnen von drei u- und v- 
Parameterlinien-Stücken gezeigt. Oben rechts ist die erste v-Parameterlinie vollständig 
gezeichnet. Unten links sind die ersten Parameterlinien-Stücke gezeichnet, die z.T. ver- 
decht sind. Unten rechts ist der Zeichenprozeß fast fertig. 
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float max_y[MAX_WIDTH] ‚min y[MAX_WIDTH] ; 


void draw_bspl_surface(m,n,nu,nv,control_ points) 
int m,n; 

int nu,nv 

point control _points[MAXPOINTS] [MAXPOINTS] ; 


{ 





int i,j; 
float u,v; 
point points1[MAXPOINTS], points2[MAXPOINTS] ,‚*p1,*p2,*help; 


du = ((float) m)/(m+4)/nu; 
dv = ((£float) n)/(n+4)/nv; 
su = ((float) 2) / (m+4); /* shift */ 
sv = ((float) 2) / (n+4); /* shift */ 


for (j=0,u=0,v=0; j<=nv; j+t+,v+=dv) { 


b_spl_s(&(points1[j]) ,‚m,n,utsu,v+sv,control_ points); 
} 
pi = pointsi; p2 = points2; 
for (i=1,u=du; i<=nu; i++,u+t=du) { 
for (j=0,v=0; j<=nv; j+t+,v+=dv) { 
b_spl_s((p2+j) ,m,n,u+tsu,v+sv,control_ points); 
if (j < nv) output piece(*(pi+j),*(pi+j+1)); 
output _piece(*(pi+j) ,*(p2+j)); 
} 


help = pi; pi = p2; p2 = help; 


output (pi); 


Abbildung 7.25: Programmskizze zum y-Puffer-Algorithmus für kubische B-Spline- 
Oberflächen (k = 4). m und n geben die Ausdehnung der Kontrollpunkt-Matrix an, 
control_ points enthält die Kontrollpunkte. nu und nv spezifizieren die Anzahl der 
zu zeichnenden Parameterlinien in u und v. b_spl_s(p,m,n,u,v,control_ points) 
berechnet den zum Parameterwert (u,v) gehörenden Punkt der B-Spline-Oberfläche 
und legt den Wert in p ab. output piece(*pi1,*p2) zeichnet das zwischen pi und p2 
liegende Stück einer Parameterlinie und verwendet max_y und min_y zur Bestimmung der 
Sichtbarkeit wie im Text beschrieben. output (p1) zeichnet die gesamte in pi abgelegte 
Parameterlinie. 


Kapitel 8 
Ray-Tracing-Verfahren 


Das Ray-Iracing-Verfahren und das im nächsten Kapitel beschriebene 
Radiosity-Verfahren sind globale Beleuchtungsverfahren, d.h. die Berechnung 
der Beleuchtung eines Objektes erfolgt global, indem andere Objekte der dar- 
zustellenden Szene berücksichtigt werden. Es wird also nicht nur die direkte 
Beleuchtung durch eine Lichtquelle dargestellt, sondern auch die indirekte Be- 
leuchtung, die dadurch entsteht, daß das Licht von anderen Objekten reflektiert 
oder transmittiert wird. Bei den in Kapitel 5 beschriebenen lokalen Verfahren 
wurde die indirekte Beleuchtung durch einen Umgebungsterm nur sehr grob 
berücksichtigt. Bei den globalen Verfahren wird dagegen die indirekte Beleuch- 
tung dadurch wesentlich besser wiedergegeben, daß außer den Lichtquellen alle 
Objekte der Szene mit in die Berechnung einbezogen werden, die von dem zu 
berechnenden Objekt aus sichtbar sind. Da dies für komplexe Szenen viele 
Objekte sein können, sind die globalen Verfahren entsprechend rechenzeitinten- 
siv. Dafür erhält man aber auch unter Umständen sehr realistisch aussehende 
Darstellungen, auf denen auch reflektierende und durchscheinende Objekte gut 
wiedergegeben sind, und die auch Phämone wie Halbschatten und mehrfache 
Reflexionen korrekt darstellen. 


Bei den globalen Beleuchtungsverfahren kann man prinzipiell zwischen Verfah- 
ren unterscheiden, die von der Position des Beobachters abhängig sind, und 
solchen, die davon unabhängig sind (vgl. [FvDFH90]). Die von der Position des 
Beobachters abhängigen Verfahren diskretisieren die Projektionsebene und be- 
stimmen dadurch Bildelemente, für die eine Berechnung der Beleuchtung durch- 
geführt wird. Bei einer Verschiebung der Projektionsebene muß die Diskretisie- 
rung und damit die Berechnung der Beleuchtung erneut durchgeführt werden. 
Das in diesem Kapitel beschriebene Ray-TIracing-Verfahren ist ein Beispiel für 
ein solches Verfahren. Die von der Position des Beobachters unabhängigen 
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Verfahren diskretisieren dagegen die darzustellende Szene und bestimmen für 
diese Diskretisierung so viel Information, daß für jede Lage der Projektionsebene 
eine relativ einfache Darstellung der Szene möglich ist. Das im nächsten Kapitel 
beschriebene Radiosity-Verfahren ist ein Beispiel für ein solches Verfahren. 


Prinzipiell kann man feststellen, daß das Ray-Tracing-Verfahren sehr gut zur 
Darstellung von spiegelnd reflektierenden und transparenten Objekten geeignet 
ist, daß es aber bei der Darstellung von diffus reflektierenden Objekten einige 
Schwächen zeigt. Das Radiosity-Verfahren ist dagegen gut für die Darstellung 
von diffus reflektierenden Objekten geeignet, ist dagegen aber (zumindest in 
der ursprünglichen Form) schlecht für die Darstellung von spiegelnder Refle- 
xion verwendbar. Wir werden im Laufe dieses und des nächsten Kapitels näher 
auf die Vor- und Nachteile der beiden Verfahren eingehen und werden auch 
eine Kombination der beiden Verfahren beschreiben, die deren Vorteile verei- 
nigt. Anwendungen der globalen Verfahren sind alle Bereiche, in denen mit 
Hilfe eines Rechners realistische Bilder eines im Rechner gespeicherten Modells 
erzeugt werden sollen. Dies umfaßt u.a. Anwendungen in der Luftfahrt (Flugsi- 
mulatoren), Architektur (Modellierung der Innenbeleuchtung eines Gebäudes), 
der Medizin (Tomographie) und der Unterhaltungsindustrie (Kinofilme). Gute 
Beschreibungen des Ray-Tracing-Verfahrens, die zum Teil weitere, hier nicht 
dargestellte Einzelheiten des Ray-Tracing-Verfahrens untersuchen, findet man 


z.B. in [FvDFH90], [BG89], [G1a89] und [Wat89]. 


Wir werden nach einer einführenden Beschreibung des Ray-Tracing-Grundalgo- 
rithmus in Abschnitt 8.1 in den Abschnitten 8.2 und 8.3 zuerst die Berechnung 
des reflektierten und gebrochenen Strahles und der lokalen Intensitätswerte be- 
schreiben. In den Abschnitten 8.4 bis 8.7 werden wir dann die für das Ray- 
Tracing-Verfahren unerläßlichen Optimierungsverfahren (umgebende Volumen, 
adaptive Tiefenkontrolle, Unterteilung des Raumes und der Strahlrichtungen) 
behandeln. 


8.1 Ray-Tracing-Grundalgorithmus 


Wie bereits erwähnt, diskretisiert das Ray-Tracing-Verfahren die Projektions- 
ebene oder genauer, den auf dem Bildschirm darzustellenden Teil der Pro- 
jektionsebene. Wir werden im folgenden der Einfachheit halber den Begriff 
Bildschirm verwenden. Die durch die Diskretisierung entstehenden Elemente 
werden als Pixel (für picture element) bezeichnet. Wir nehmen im Moment an, 
daß die darzustellende Szene nur eine Lichtquelle enthält. Physikalisch kann 
man sich die Situation so vorstellen, daß die Lichtquelle Photonen aussendet, 
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von denen beim Auftreffen auf die Objekte der Szene je nach Eigenschaften 
der Oberflächen ein Teil reflektiert, transmittiert oder absorbiert wird. Die 
Farbe und Helligkeit eines Pixels wird durch die Energie und die Anzahl der 
pro Zeit auf der Pixelfläche auftreffenden Photonen bestimmt, vgl. Abschnitt 
5.1. Diese Photonen können direkt von der Lichtquelle kommen oder können 
von Objekten der Szene (evtl. mehrfach) reflektiert oder transmittiert worden 
sein. Beim Ray-Tracing-Verfahren versucht man die Farbe und Helligkeit eines 
Pixels dadurch zu bestimmen, daß man dıe Bahn der Photonen von dem Pixel 
zu der Lichtquelle zurückverfolgt (daher kommt auch die manchmal verwen- 
dete deutsche Bezeichnung Strahlrückverfolgung) und dabei die Oberflächen- 
und Materialeigenschaften der getroffenen Objekte berücksichtigt. Es wird also 
versucht, die Photonenbahnen in der umgekehrten Richtung zu rekonstruieren, 
in der sie von den Photonen durchlaufen werden. 


Dazu verwendet das Ray-Tracing-Verfahren für jedes Pixel des Bildschirms 
einen Strahl, der auch als Projektor bezeichnet wird. Für perspektivische Pro- 
jektionen verläuft dieser Strahl durch das Projektionszentrum und das Pixel. 
Für parallele Projektionen hat der Strahl die Richtung der Projektion und 
verläuft durch das Pixel. Das Ray-Tracing-Verfahren berechnet zu jedem 
dieser Strahlen den Schnittpunkt mit dem am nächsten zum Betrachter lie- 
genden Objekt. Wenn der Schnittpunkt direkt von der Lichtquelle beleuchtet 
wird, errechnet man aus den Eigenschaften des Objektes und der Lichtquelle 
und deren Lage lokale Intensitätswerte!, siehe Abschnitt 8.3. Ob ein Objekt 
direkt von der Lichtquelle beleuchtet wird, kann man dadurch feststellen, daß 
man einen Strahl von dem gefundenen Schnittpunkt zu der Lichtquelle schickt. 
Wenn dieser Strahl ein anderes (undurchsichtiges) Objekt trifft, wird das Ob- 
jekt nicht direkt von der Lichtquelle beleuchtet, es liegt im Schatten und das 
Licht kann nicht direkt von der Lichtquelle auf das Objekt fallen. Deshalb 
errechnet man auch keine lokalen Werte, der lokale Beitrag ist 0 (schwarz). 
Wenn das dazwischenliegende Objekt durchscheinend ist, muß der Strahl wie 
unten beschrieben weiterverfolgt werden, wobei je nach Transparenz des Ob- 
jektes eine Abschwächung berücksichtigt wird. Der Strahl bis zum ersten ge- 
fundenen Schnittpunkt wird als Primärstrahl oder Pixelstrahl bezeichnet. Den 
zur Lichtquelle ausgesandten Strahl bezeichnet man auch als Schattenfühler. 


Für die Implementierung legt man z.B. das RGB-Modell zugrunde (vgl. Abschnitt 2.6) 
und berechnet für jede der drei Grundfarben rot, grün und blau einen Intensitätswert zwi- 
schen 0 und 1. Bei einem mit dem RGB-Modell arbeitenden Farbbildschirm besteht jedes 
Pixel eigentlich aus drei Pixeln, einem roten, einem grünen und einem blauen, die getrennt 
angesteuert werden können. Diese Farbpixel werden je nach dem für sie errechneten Inten- 
sitätswert gesetzt. Wir verwenden im folgenden meistens den Begriff Intensitätswert und 
meinen damit die drei Intensitätswerte für die drei Grundfarben. 
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Wenn die darzustellende Szene mehrere Lichtquellen enthält, muß man zu jeder 
Lichtquelle einen Schattenfühler aussenden. 


Im einfachsten Fall ist das erste geschnittene Objekt nicht durchscheinend und 
hat eine nicht spiegelnd reflektierende Oberfläche. In diesem Fall kann der 
Ray-Tracing-Prozeß abgebrochen werden. Die Intensitätswerte des zum Strahl 
gehörenden Pixels ergeben sich aus den errechneten lokalen Intensitätswerten. 
Wenn das erste geschnittene Objekt teilweise reflektierend oder durchscheinend 
ist, können Photonen dadurch zu dem betrachteten Pixel gelangen, daß sie von 
dem Objekt reflektiert oder transmittiert werden. Deshalb müssen bei der Be- 
stimmung der Intensitätswerte des Pixels auch die Beiträge von reflektierten 
und transmittierten Strahlen berücksichtigt werden. Dazu startet das Verfah- 
ren von dem gefundenen Schnittpunkt aus zwei sogenannte Sekundärstrahlen, 
einen für die Reflexion, einen für die Transmission. Die Richtung dieser Strahlen 
ergibt sich aus den Reflexions- und Transmissionsgesetzen, vgl. Abschnitt 8.2. 
Diese Sekundärstrahlen werden rückwärts weiterverfolgt, und es wird wieder der 
Schnittpunkt mit dem am nächsten liegenden Objekt bestimmt, ebenso die zu 
diesem Schnittpunkt gehörenden Intensitätswerte. Je nach Eigenschaften der 
Objekte müssen dazu weitere Strahlen ausgesandt werden, vgl. Abbildung 8.1. 
Die Intensitätswerte dieses Objektes werden zu den für den ersten Schnittpunkt 
errechneten lokalen Werten gewichtet hinzuaddiert, wobei die Gewichtung umso 
größer ist, je reflektierender bzw. transparenter das erste geschnittene Objekt 
ist. Diese Summe ist dann der an das betrachtete Pixel weitergegebene Inten- 
sitätswert. Für den zweiten Schnittpunkt werden die Intensitätswerte analog 
bestimmt, die gewichtete Summe wird an den ersten Schnittpunkt weitergege- 
ben. Für jeden Schnittpunkt werden also drei Komponenten für die Intensitäts- 
werte bestimmt: eine lokale Komponente, eine Reflexionskomponente und eine 
Transmissionskomponente. 


Der Prozeß der Aufteilung der Strahlen läßt sich durch einen Baum beschrei- 
ben, den sogenannten Strahlbaum, siehe auch Abbildung 8.1. Die Wurzel des 
Baumes ist das betrachtete Pixel, alle anderen Knoten sind Schnittpunkte des 
von diesem Pixel ausgesandten Strahles mit Objekten der Szene. Die Anzahl 
der Kinder eines Knotens entspricht der Anzahl der Strahlen, die von dem zu- 
gehörigen Schnittpunkt ausgesandt werden. Nach der bisherigen Beschreibung 
werden immer dann neue Strahlen ausgesandt, wenn das gefundene Objekt teil- 
weise reflektierend oder durchscheinend ist. Wenn alle Objekte der Szene diese 
Eigenschaft haben, wird dieses Verfahren nur dann terminieren, wenn irgend- 
wann alle Strahlen die Szene verlassen. Da dies recht unwahrscheinlich ist, sollte 
der Prozeß der Aufteilung in zusätzliche Strahlen irgendwann unterbrochen wer- 
den. Eine einfache Methode besteht darin, eine maximale Tiefe für den Strahl- 
baum festzulegen. Es werden von einem gefundenen Schnittpunkt nur dann 
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Bildschirm 


Abbildung 8.1: Veranschaulichung des Ray-Tracing-Verfahrens für eine einfache Szene 
mit drei Objekten: der für das betrachtete Pixel verwendete Primärstrahl trifft Objekt 
A, das teilweise reflektierend und teilweise transparent ist. Dementsprechend werden 
außer dem Schattenfühler ein Reflexions- und ein Transmissionsstrahl ausgesandt. Der 
Reflexionsstrahl trifft Objekt C, von dem wir annehmen, daß es nicht transparent ist. 
Der Transmissionsstrahl trifft Objekt B, das ebenfalls transparent ist. Die von B und 
C ausgesandten Schattenfühler sind nicht eingezeichnet. Der zu der Szene gehörende 
Strahlbaum ist rechts wiedergegeben. L steht dabei für Lichtquelle. 
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void ray_trace() 


RAY ray; 
float intensity; 
for (each pixel P) do 


ray = compute.ray(P); 
intensity = trace(ray,0); 
color pixel(P,intensity); 





Abbildung 8.2: Programmskizze des Ray-Tracing-Grundalgorithmus: RAY ist eine Da- 
tenstruktur zur Ablage eines Strahles, die den Startpunkt und die Richtung des Strahles 
enthält. compute_ray(P) ist eine Funktion, die zu einem Pixel P und der verwendeten 
Projektion den zugehörigen Strahl berechnet. color pixel(P,intensity) stellt Pixel 
P mit Intensität intensity dar. Die Prozedur trace ist in Abbildung 8.3 dargestellt. 


neue Strahlen ausgesandt, wenn die maximale Tiefe noch nicht erreicht ist. Für 
das erzeugte Bild bestimmt diese maximale Tiefe, wieviele hierarchische Wider- 
spiegelungen in einem Objekt gefunden werden können. Üblicherweise werden 
für die maximale Tiefe Werte zwischen 3 und 8 verwendet. Bei maximaler Tiefe 
2 kann man ein sich in einem Objekt A wiederspiegelndes Objekt B erkennen. 
Bei maximaler Tiefe 3 kann man auf dem Spiegelbild von Bin A ein in B ge- 
spiegeltes Objekt C’ erkennen, immer vorausgesetzt, daß es diese Objekte gibt. 
Eine andere Methode zur Terminierungskontrolle des Ray-Tracing-Verfahren 
ist in Abschnitt 8.5 beschrieben. 


Das Ray-TIracing-Verfahren läßt sich am einfachsten durch eine rekursive Pro- 
zedur beschreiben. Eine Programmskizze des gerade beschriebenen Grundalgo- 
rithmus ist in Abbildung 8.2 wiedergegeben, vgl. auch [JGMH88]. Diese Imple- 
mentierung hat den Nachteil, unnötige rekursive Aufrufe zu erzeugen: die Pro- 
zeduraufrufe auf der untersten Rekursionsstufe werden direkt nach dem Aufruf 
wieder verlassen, weildepth > max_depth ist. Das bedeutet neben dem unnöti- 
gen Aufwand für den Prozeduraufruf auch, daß die Berechnung von Reflexions- 
strahl und Transmissionsstrahl in der darüberliegenden Prozedur-Inkarnation 
unnötig ist. Zur Abhilfe kann man die Abbruchbedingung verschieben und 
erhält die in Abbildung 8.4 wiedergegebene verbesserte Version. 


Eine sehr angenehme Eigenschaft des Ray-Tracing-Verfahrens besteht darin, 
daß die Eliminierung verborgener Oberflächen entfallen kann, weil das Verfahren 
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float trace (r, depth) 
RAY r; int depth; 
{ 
POINT s; 
RAY refl,trns; 
float Iloc,I.ref,I_trn; 




















if (depth > max_depth) return BLACK; 
if ((s = intersect(r)) == NULL) return BACKGROUND; 
if (is_illuminated(s)) 

I_loc = compute_loc(s); 
else I_lloc = BLACK; 
refl = compute reflection ray(r,s); 
I_ref = trace(refl,depth+1); 
trns = compute_transmission ray(r,s); 
I_trn = trace(trns,depth+1); 
return combine(I_loc,I_ref,I_trn); 


Abbildung 8.3: Programmskizze der rekursiven Prozedur trace. Die spezifizierte ma- 
ximale Tiefe des Strahlbaumes ist max_depth+1. max_depth ist eine globale Variable. 
intersect(r) bestimmt den Schnittpunkt des Strahles r mit den Objekten der Szene, 
der dem Startpunkt am nächsten liegt. is_illuminated(s) bestimmt, ob s direkt von 
der Lichtquelle beleuchtet wird. compute reflection ray (r,s) berechnet den zu 
Strahl r und Schnittpunkt s gehörenden Reflexionsstrahl, compute_transmission ray 
(r,s) berechnet den Transmissionsstrahl. compute_loc(s) berechnet für Schnitt- 
punkt s die lokale Intensität. Die zu dem Reflexionsstrahl und dem Transmissions- 
strahl gehörenden Intensitäten werden durch rekursive Aufrufe von trace berechnet. 
combine(I_loc,I_ref,I_trn) kombiniert die drei berechneten Intensitäten entspre- 
chend den Eigenschaften des Objektes, zu dem der gefundene Schnittpunkt s gehört. 
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float trace (r, depth) 
RAY r; int depth; 
{ 
POINT s; 
RAY refl,trns; 
float Iloc,I_ref,I_trn; 

















if ((s = intersect(r)) == NULL) return BACKGROUND; 
if (is_illuminated(s)) 
I_loc = compute_loc(s); 
else I_loc = BLACK; 
‚if (depth == max_depth) 
return combine(I_loc,BLACK,BLACK); 
else { 
refl = compute reflection ray(r,s); 
I_ref = trace(refl,depth+1); 
trns = compute transmission ray(r,s); 
I_trn = trace(trns,depth+1); 
return combine(I_loc,I_ref,Itrn); 


Abbildung 8.4: Verbesserte Version der rekursiven Prozedur trace, die für die Blätter 
des Strahlbaumes keine rekursiven Aufrufe mehr erzeugt. 
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sowieso zu jedem Pixel das sichtbare Objekt bestimmt. 


Ein Blick auf Abbildung 8.2 und 8.4 zeigt, daß das Ray-Tracing-Verfahren 
sich durch die angegebene rekursive Prozedur sehr einfach beschreiben läßt 
und daß es auch nicht besonders schwierig ist, das Verfahren zu implemen- 
tieren. In der beschriebenen Form ist das Ray-Tracing-Verfahren aber ex- 
trem rechenzeitaufwendig: um den Schnittpunkt eines Strahles mit dem am 
nächsten liegenden Objekt zu finden, muß man den Strahl mit allen Objek- 
ten der Szene schneiden und unter den gefundenen Schnittpunkten denjenigen 
auswählen, der am nächsten zum Aufpunkt des Strahles liegt. Dies muß für je- 
den ausgesandten Strahl durchgeführt werden, sei es Pixelstrahl, Sekundärstrahl 
oder Schattenfühler. Die Anzahl der Schnittpunktberechnungen wächst also 
mit dem Produkt aus der Anzahl der Suchstrahlen und der Anzahl der Ob- 
jekte. Ein einfaches Beispiel soll den erheblichen Aufwand belegen: Gegeben 
sei ein Bildschirm der Auflösung 1000 x 1000 und eine Szene mit 1000 teil- 
weise transparenten und teilweise reflektierenden Objekten. Für jedes Pixel 
wird ein Primärstrahl ausgesandt, es werden also insgesamt 10° Primärstrah- 
len verwendet. Wenn wir 4 als maximale Tiefe des Strahlbaumes annehmen, 
so werden für jeden Primärstrahl 3? = 27 weitere Strahlen ausgesandt: für 
jeden Schnittpunkt ein Schattenfühler, ein Reflexionsstrahl und ein Transmis- 
sionsstrahl. Für jeden dieser Strahlen muß der Schnittpunkt mit allen 1000 
Objekten bestimmt werden. Das führt zu einer Gesamtanzahl von 2.7 - 10! 
Schnittpunktberechnungen. Bei Verwendung von mehreren Lichtquellen erhöht 
sich diese Zahl noch einmal, weil wir für jede Lichtquelle einen Schattenfühler 
verwenden müssen. Für fünf Lichtquellen kommt man z.B. auf eine Gesamtan- 
zahl von 3.43 : 101! Schnittpunktberechnungen. Je nach Aussehen der Ob- 
jekte sind die Schnittpunktberechnungen entsprechend aufwendig. Wenn wir 
annehmen, daß der verwendete Rechner in der Lage ist, eine Million Schnitt- 
punktberechnungen in der Sekunde auszuführen braucht die Berechnung eines 
einzigen Bildes der beschriebenen Komplexität 95 Stunden! Dies ist ein für 
die Praxis nicht annehmbarer Wert. Deshalb wurden Optimierungsverfahren 
entwickelt, die diese Laufzeit reduzieren helfen. Unser Beispiel läßt vermuten, 
daß eine Implementierung des Ray-Tracing-Verfahrens die meiste Zeit mit der 
Berechnung von Schnittpunkten verbringt. Dies stimmt auch in der Praxis: für 
komplexe Szenen braucht braucht ein typischer Ray-Tracer über 95% seiner 
Rechenzeit zur Berechnung von Schnittpunkten, vgl. [Whi80]. Deshalb ist der 
Hauptangriffspunkt der Optimierungsverfahren die Optimierung der Schnitt- 
punktberechnung. Dazu gibt es prinzipiell zwei Möglichkeiten: man reduziert 
die Kosten der einzelnen Schnittpunktberechnung oder/und die Gesamtanzahl 
der Schnittpunktberechnungen. Beide Ansätze werden wir in den Abschnitten 
8.4 bis 8.7 untersuchen. Zunächst werden wir jedoch im nächsten Abschnitt be- 
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E Abbildung 8.5: Veranschaulichung 


der perfekt spiegelnden Reflexion: 
| ' 


schreiben, wie die reflektierten und transmittierten Strahlen berechnet werden. 


a 


8.2 Reflexion und Transmission 


Beim Auftreffen eines Strahles auf die Oberfläche eines teilweise reflektieren- 
den, teilweise transparenten Objektes werden beim Ray-Tracing-Verfahren 
zwei neue Strahlen erzeugt: ein reflektierter Strahl und ein gebrochener Strahl. 
In diesem Abschnitt beschreiben wir, wie diese Strahlen aus dem einfallen- 
den Strahl berechnet werden. Dabei nehmen wir im Moment an, daß perfekte 
spiegelnde Reflexion und Transmission vorliegt. Mit den aus dieser Annahme 
resultierenden Nachteilen und wie man sie beheben kann, werden wir uns später 


beschäftigen. 


8.2.1 Berechnung des reflektierten Strahls 


Sei I der Richtungsvektor des einfallenden Strahles und sei n der Normalenvek- 
tor der betrachteten Oberfläche. Wir nehmen an, daß I und n n normiert sind. 
Wir wollen den Richtungsvektor des reflektierten Strahles R berechnen. a; sel 
der Winkel zwischen —/ und ni, a, sei der Winkel zwischen Rundii rn, vgl. Ab- 
bildung 8.5. Zur Berechnung von R benutzen wir zwei physikalische Gesetze, 
vgl. Abschnitt 5.1: Das erste Gesetz besagt, daß T, A und Rin einer Ebene 
liegen, d.h. R ist als Linearkombination von I und fi darstellbar: R= al + fi. 
Das zweite Gesetz besagt, daß der Einfallswinkel gleich dem Ausfallswinkel ist, 
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Abbildung 8.6: Veranschaulichung 
der beschriebenen geometrischen 
Lösung. Da I und Ä normalisiert sind, 
gilt: cosa, = z und cosa; = y. We- 
gen a; = a, gilt deshalb auch x = y. 





d.h. daß der Winkel zwischen R und üü gleich dem Winkel zwischen -I und 


ist: ; = Q,. 


Zur Berechnung von R wählen wir hier eine geometrische Lösung: Sei z die 
Länge der Projektion von R auf n, y die Länge der Projektion von I auf n, 
vgl. Abbildung 8.6. Es gilt wegen e=yundy=cosay=-J-ü: 


R = zätyü+l 

2ya+l 

2cos(;)a+I 

= I-al-.n)n - (8.1) 


Da I und fi normiert sind, ist der mit (8.1) errechnete Reflexionsvektor R auch 
normiert. 


8.2.2 . Berechnung des gebrochenen Strahles 


Sei wieder I der Richtungsvektor des einfallenden Strahles und n der Norma- 
lenvektor der betrachteten Oberfläche. Beide seien normiert. Wir wollen den 
Richtungsvektor des transmittierten Strahles T berechnen. Wir nehmen an, 
daß der Strahl von einem Medium mit dem Brechungsindex nı in ein Medium 


312 KAPITEL 8. RAY-TRACING-VERFAHREN 


Abbildung 8.7: Veranschaulichung 
der perfekt spiegelnden Transmission. 
Wiedergegeben ist die Situation für 
n2 > m. In diesem Fall wird T 
zum Normalenvektor hin gebrochen, 
d.h. es st u < &. Für m < m 
wird T vom Normalenvektor weg ge- 
brochen. 





mit dem Brechungsindex nz eintritt. a; sei der Winkel zwischen -I und ni, ou 
sei der Winkel zwischen T' und —r, vgl. Abbildung 8.7. Zur Berechnung von T' 
benutzen wir zwei physikalische Gesetze, vgl. Abschnitt 5.1: Das erste Gesetz 
besagt, daß T, # und T in einer Ebene liegen, d.h. T' ist als Linearkombination 
von /undi darstellbar: _ ö 
T=al+Ppn 
Das zweite Gesetz ist das Snell’sche Gesetz, das eine Beziehung zwischen o; 
und «; herstellt: 
sına; m 


: = -m2 
sın Or 7 


Zur Berechnung von T', von dem wir annehmen, daß es normiert ist, wählen 
wir hier wieder eine geometrische Lösung: Sei %’ ein Vektor, der die gleiche 
Richtung wie hat und dessen Länge sich aus der Projektion von T auf ü 
ergibt. Sei T’ ein Vektor, der die gleiche Richtung wie I hat und dessen Länge 
so gewählt ist, daß die Projektion von I ’' auf fü die gleiche Länge hat wie die 


Projektion von T auf ii, vgl. Abbildung 8.8. Dann ist 2= I  — (—n') ein Vektor, 
der senkrecht zu n steht. Es gilt: 


T= -H Hk 
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Abbildung 8.8: Veranschaulichung 
der Berechnung von T: £ verbindet 
die Spitze von —i’ mit der Spitze von 
T', k£ verbindet "die Spitze von —' 
mit der Spitze von T. kä£ ist we- 
gen der Übersichtlichkeit etwas ver- 
setzt eingezeichnet. 





= -H+kl@ + 
= kl +(k-1)# (8.2) 


Wir werden jetzt rn, I’undk bestimmen. Die Projektion von, I’ auf fü hat die 
Länge |/’|cosa;. Die Projektion von T auf fü hat die Länge |T'| cos a; = cos ay. 


Nach Definition von /’ gilt somit |n’| = IT| cos = cosax. Damit ist 
+ C0S@ 
MS, 
COS Q; 
und 


” .C05% > 
ı__ I t7T 


u er 
und N =cosan 
COS &; 


Weiter gilt |] = In +7] = I7’|sin a; und kl’ + 7’|= sin alT| = sina,. Daraus 
folgt 


sin &% sina;cosa; tan 





I + r cosa,sina; tan 


Einsetzen von f, I’ und k in (8.2) liefert: 


- tan a,cosa; >. ‚tan _ 
= ——] - l)cosay rn 
tan @; Cosa; tan &; 
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_ Ana 7, (ee _ cos «) ä 





sin &; sin @; 
1? 1 
= n7ı (Fosaı- oa) n 
n2 n2 


Einen Ausdruck für cos a; erhält man wie folgt: Wegen des Snell’schen Gesetzes 
gilt: 


2 
sin’; = sin?(e,) (7) 


n2 


Daraus folgt für cos &: 


csu = Vl-sin« 
2 
1- sin?’ a; (?) 
n2 


2 
1+(cos®?; -1) (7) 


n2 


Mit cosa; = -I-ü erhält man damit für T: 


2 
T=-1%7+ -#75- 14 da (®) |: 
n2 n2 


8.3 Berechnung der (lokalen) Intensitätswerte 


Wie in Abschnitt 8.1 beschrieben, berechnet man beim Ray-Tracing-Verfahren 
für den gefundenen Schnittpunkt des Suchstrahles mit einem Objekt lokale 
Intensitätswerte, die die direkten Beleuchtung des Schnittpunktes durch eine 
Lichtquelle beschreiben. Die durch indirekte Beleuchtung entstehenden globa- 
len Intensitätswerte werden - wie beschrieben - durch rekursive Anwendung des 
Verfahrens auf den reflektierten und den transmittierten Strahl errechnet. Wir 
werden in diesem Abschnitt beschreiben, wie man die lokalen Intensitätswerte 
berechnet und wie man sie mit den von den rekursiven Aufrufen zurückgeliefer- 
ten globalen Werten zu einem Gesamtwert verknüpft. 


Zur Berechnung der lokalen Intensitätswerte wird oft das in Abschnitt 5.3 be- 
schriebene Phong-Reflexionsmodell verwendet, vgl. [Whi80], [FvDFH90] und 
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[Wat89]. Die Anwendung von aufwendigeren Modellen (Torrance- oder Hall- 
Modell) ist z.B. in [Gla89], [CT81] und [HG83] beschrieben. Das Phong- 
Reflexionsmodell berücksichtigt die direkte Beleuchtung durch zwei Terme: ein 
Term beschreibt die diffuse Reflexion der betrachteten Oberfläche, der andere 
deren spiegelnde Reflexion. Der dritte verwendete Term ist der sogenannte 
Umgebungsterm, der die indirekte Beleuchtung beschreibt. Beim Ray-Tracing- 
Verfahren wird die indirekte Beleuchtung, die durch spiegelnde Reflexion oder 
Transmission des von anderen Objekten kommenden Lichtes entsteht, durch 
rekursive Aufrufe berechnet. Die durch diffuse Reflexion oder Transmission 
entstehende indirekte Beleuchtung wird dagegen durch diese Aufrufe nicht er- 
faßt und muß deshalb durch den beim Phong-Reflexionsmodell verwendeten 
Umgebungsterm beschrieben werden. Der Grund dafür, daß nicht auch diese 
diffuse Interaktion zwischen Objekten durch rekursive Aufrufe bestimmt wird, 
liegt darin, daß das diffus reflekierte oder transmittierte Licht in alle Richtun- 
gen gleichmäßig abgestahlt wird, siehe Abschnitt 5.3. Für einen gefundenen 
Schnittpunkt eines Suchstrahles mit einem Objekt kann also das von ande- 
ren Objekten diffus reflektierte oder transmittierte Licht aus allen möglichen 
Richtungen kommen. Es ist aber wegen dem sowieso schon enormen Kosten- 
aufwand des Verfahrens nicht möglich, ein Strahlenbündel auszusenden, das alle 
Richtungen ausreichend dicht erfaßt. 


Beim ursprünglichen Phong-Reflexionsmodell, wie wir es in Abschnitt 5.3 be- 
schrieben haben, werden keine transparenten Objekte berücksichtigt, weil das 
Modell ursprünglich nicht für die Darstellung von transparenten Objekten ge- 
dacht war. Für die Anwendung im Ray-Tracing-Verfahren müssen wir das 
Modell daher um einen Term erweitern, der für transparente Objekte die di- 
rekte Beleuchtung beschreibt, die dadurch entsteht, daß das direkt von der 
Lichtquelle kommende Licht das Objekt durchdringt. Wir werden uns jetzt 
kurz damit beschäftigen, wie dieser Term aussehen sollte. 


Die meisten in der Realität auftretenden transparenten Objekte sind nicht 
vollständig transparent. Sie verwischen das hindurchtretende Licht und 
schwächen es ab. Das Verwischen rührt daher, daß die Oberfläche nicht voll- 
kommen eben ist. Im Modell bedeutet das, daß das transmittierte Licht nicht 
nur in die nach den Transmissionsgesetzen theoretisch errechnete Richtung T 
geworfen wird, sondern auch in benachbarte Richtungen, dies aber umso weniger, 
je weiter diese Richtung von T entfernt ist, siehe Abbildung 8.9. Bei der spie- 
gelnden Reflexion hatten wir eine ähnliche Situation vorliegen: auch dort wurde 
Licht nicht nur in die theoretisch errechnete Reflexionsrichtung R, sondern auch 
in benachbarte Richtungen V abgestrahlt. Dort haben wir das Problem durch 
Einführung eines Terms cos” d, gelöst, wobei d, der Winkel zwischen R und 
V war. m ist eine materialabhängige Konstante. Wir gehen hier ähnlich vor: 
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Abbildung 8.9: Das aus Richtung der Lichtquelle Z kommende Licht wird nicht nur in 
die theoretisch errechnete Richtung R bzw. T' reflektiert oder transmittiert, sondern auch 
in benachbarte Richtungen V. 
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wir verwenden einen Term cos?d;, wobei d; der Winkel zwischen T und V ist. 
p ist wieder eine materialabhängige Konstante. Die lokale Intensität, die von 
der Beleuchtung der Lichtquelle Z herrührt und die in Richtung V abgestrahlt 
wird, berechnet sich damit zu 


Tiocal = ’P ' ka + fa (Teinpkalä ‘ L) + k,cos” d, + kıcos” 4.) 
Tas kat fa (Tenskalü: 2) + kl V)" + DDP) 


Dabei ist k, der diffuse, k, der spiegelnde Reflexionskoeflizient, k, ist der 
Umgebungs-Reflexionskoefhizient, vgl. Abschnitt 5.3. kı ist der material- 
abhängige (spiegelnde) Transmissionskoeffizient, der angibt, wie lichtdurchlässig 
ein Objekt ist. Alle diese Koeffizienten haben Werte zwischen 0 und 1. Wenn die 
Lichtquelle auf der gleichen Seite eines Objektes wie der Beobachter liegt, liefert 
nur die spiegelnde Komponente einen Beitrag zu /ioc.ı. Wenn Lichtquelle und 
Beobachter auf unterschiedlichen Seiten eines transparenten Objektes liegen, 
liefert nur die transparente Komponente einen Beitrag. 


Zur Berechnung der Gesamtintensität, die von einem Punkt abgestrahlt wird, 
werden zu der lokalen Komponente Iıocaı zwei globale Komponenten /, und I: 
addiert, deren Wert durch die rekursiven Aufrufen für reflektierten und trans- 
mittierten Strahl berechnet werden. Diese globalen Komponenten werden mit 
dem spiegelnden Reflexions- bzw. Transmissionskoeffizienten des zugehörigen 
Objektes gewichtet, d.h. sie werden umso mehr berücksichtigt, je reflektierender 
bzw. transparenter das Objekt ist. Damit erhält man für die Gesamtintensität: 


I ges — Tiocal + kslr + kılı (8.3) 


Tabelle 8.1 faßt noch einmal zusammen, welcher Term welches physikalische 
Phänomen beschreibt. Anhand dieser Tabelle erkennt man auch die beiden 
wesentlichen im Ray-Tracing-Verfahren enthaltenen Vereinfachungen: Die er- 
ste Vereinfachung besteht darin, daß das von anderen Objekten abgestrahlte 
Licht, das auf den betrachteten Punkt der Oberfläche fällt und das in Richtung 
des Betrachters diffus reflektiert wird, nur über den konstanten Umgebungsterm 
k,I. berücksichtigt wird. Die zweite Vereinfachung besteht darin, daß die durch 
die rekursiven Aufrufe rückverfolgten Strahlen für Reflexion und Transmission 
einzelne, unendlich dünne Strahlen sind, man nimmt also perfekte spiegelnde 
Reflexion und Transmission an. Es wird nicht berücksichtigt, daß aus benach- 
barten Richtungen ebenfalls Licht von anderen Objekten eintreffen kann, das in 
Richtung des Betrachters geworfen wird, weil die betrachtete Oberfläche nicht 
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Dieser Term beschreibt die diffuse Reflexion 
zwischen Objekten. | 


A, Dieser Term beschreibt die diffuse Reflexion, 
Teint faka (RL) die von der direkten Beleuchtung durch die 
Lichtquelle herrührt. 


Wenn Lichtquelle und Betrachter auf der glei- 
chen Seite des Objektes liegen, beschreibt die- 
ser Term, wieviel Licht, das direkt von der 
Lichtquelle kommt, in Richtung des Betrach- 
ters reflektiert wird. 


Tanf faks (R- V)" 


Wenn Lichtquelle und Betrachter auf unter- 
schiedlichen Seiten der Oberfläche liegen, be- 
schreibt dieser Term, wieviel Licht, das direkt 
von der Lichtquelle kommt, in Richtung des 
Betrachters transmittiert wird. 


Tanf fakı (T- V)P 


Dieser Term beschreibt das von anderen Ob- 
jekten (spiegelnd oder diffus) abgestrahlte 
Licht, das so auf den betrachteten Punkt fällt, 
daß in Richtung des Betrachters durch spie- 
gelnde Reflexion eine gewisse Lichtmenge ge- 
worfen wird. 


Dieser Term beschreibt das von anderen Ob- 
jekten (spiegelnd oder diffus) abgestrahlte 
Licht, das so auf den betrachteten Punkt fällt, 
daß ın Richtung des Betrachters durch spie- 
gelnde Transmission eine gewisse Lichtmenge 
geworfen wird. 





Tabelle 8.1: Zusammenfassung der für einen gefundenen Schnittpunkt errechneten In- 
tensitätswerte. Die oberhalb des Doppelstrichs stehenden Terme werden lokal berechnet. 
Die unterhalb des Doppelstrichs stehenden Terme werden durch rekursive Aufrufe global 
berechnet. 
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Abbildung 8.10: Die Gauß’sche Glockenkurve hat ihr Maximum und Symmetriezentrum 
an Stelle d = 0. co gibt den Abstand vom Symmetriezentrum zu den Wendepunkten 
der Kurve an und kann wahrscheinlichkeitstheoretisch als Standardabweichung gedeutet 
werden. In der Abbildung sind die Kurven für o = 1 und o = 1/2 wiedergegeben. 


perfekt spiegelnd oder transmittierend ist. Dieses Phänomen wurde nur für 
die Berechnung der lokalen Intensität, d.h. bei der Berechung der direkten Be- 
leuchtung berücksichtigt. Der Grund für diese Vereinfachung liegt wie bereits 
erwähnt im Rechenaufwand, der erforderlich wäre, wenn man dies bei der glo- 
balen Berechnung berücksichtigen wollte: man müßte rekursiv rückverfolgte 
Strahlen für die Reflexion und Transmission nicht nur in die theoretisch errech- 
nete Richtung aussenden, sondern auch in viele benachbarte Richtungen, was zu 
einer Vervielfachung des Rechenaufwands führen würde. Die praktische Folge 
dieser Vereinfachung ist, daß das Bild eines Objektes Oı in einem Objekt O; 
immer so aussieht, als ob O3 perfekt spiegelnd wäre. Dies gibt den dargestellten 
Szenen meist ein “superrealistisches” Aussehen, weil die in der Realität auftre- 
tenden Verzerrungen der reflektierten Spiegelbilder fehlen. Aus dem gleichen 
Grund sind die dargestellten Schatten zu scharf und es treten Aliasing-Effekte 
auf, die von der Diskretisierung des Bildschirms herrühren: Für benachbarte 
Pixel Pı und P, kann der Suchstrahl für P, ein Objekt knapp treffen, der Such- 
strahl für P, kann das Objekt knapp verfehlen. Wenn die für die Pixel errechne- 
ten Intensitätswerte nicht mit einem Anti-Aliasing-Verfahren (vgl. Abschnitt 
2.7) nachbereitet werden, treten sehr leicht die für Aliasing-Effekte typischen 
gezackten Linien auf. 


Eine Abhilfe liefert das sogenannte verteilte oder probabilistische Ray-Tracing, 
wie es in [CPC84] oder etwas ausführlicher in [Gla89] beschrieben wird. Bei 
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diesem Verfahren werden für Reflexion und Transmission weiterhin einzelne 
Strahlen ausgesandt. Diese haben aber nicht genau die mathematisch berech- 
nete Richtung, sondern weichen von dieser um einen kleinen, zufällig gewählten 
Betrag ab. Diese Abweichung kann innerhalb eines vorgegebenen Bereiches 
entweder rein zufällig gewählt werden oder es kann eine Wahrscheinlichkeits- 
verteilung zugrunde gelegt werden, die bewirkt, daß kleinere Abweichungen 
häufiger gewählt werden als größere. Eine oft verwendete Wahrscheinlichkeits- 
verteilung ist die Gauß’sche Verteilung, die die bekannte Glockenkurve liefert, 
siehe Abbildung 8.10. Wenn d die Abweichung von der mathematisch errech- 
neten Richtung ist, dann wird die Abweichung d mit Wahrscheinlichkeit 


w(d) _ 1 „-@/202 
270 


gewählt. Dabei ist « eine Konstante, die die Breite der Kurve angibt. Wie 
spiegelnd eine Oberfläche dargestellt werden soll, kann über den Parameter o 
gesteuert werden: je spiegelnder die Oberfläche dargestellt werden soll, desto 
öfter soll die mathematisch errechnete Richtung gewählt werden, desto spitzer 
soll also die Glockenkurve sein, desto kleiner muß also der Parameter o gewählt 
werden. 


Durch Anwendung des Verfahrens auf die ausgesandten Suchstrahlen für Refle- 
xion und Transmission erreicht man eine verwischte Darstellung der reflektierten 
Spiegelbilder von Objekten und von hinter transparenten Objekten sichtba- 
ren Objekten. Der Grad der Verwischung kann über den Parameter o der 
Verteilungsfunktion gesteuert werden. Die Anwendung der Technik auf die 
Schattenfühler kann zur Darstellung von Schattenübergängen genutzt werden. 
Außerdem werden die auftretenden Aliasing-Effekte abgeschwächt. 


8.4 Umpgebende Volumen 


In diesem Abschnitt wollen wir uns damit beschäftigen, wie man die Kosten 
der einzelnen Schnittpunktberechnung reduzieren kann. Dies bringt vor allem 
für komplexe Objekte mit aufwendiger Schnittpunktberechnung eine große Ein- 
sparung von Rechenzeit. Wenn das Objekt z.B. ein Polyeder ist, muß man 
zur Berechnung der Schnittpunkte zwischen dem Strahl und dem Objekt alle 
Seiten des Polyeders auf Schnittpunkte testen. Wenn die Seitenflächen des Po- 
lyeders anstatt durch ebene Flächen durch gekrümmte Oberflächen definiert 
sind (vgl. Kapitel 7), ist auch die einzelne Schnittpunktberechnung aufwendig. 
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Die Verfahren zur Reduzierung der Kosten der einzelnen Schnittpunktberech- 
nung stützen sich auf die Beobachtung, daß in einer Szene mit vielen Objekten 
üblicherweise nur wenige Objekte von dem gerade untersuchten Strahl getrof- 
fen werden. Die meisten Objekte nehmen nur einen kleinen Raumbereich ein 
und die Wahrscheinlichkeit, daß der Strahl gerade diesen Raumbereich trifft, 
ist relativ gering. Dementsprechend ist es sinnvoll, die Schnittpunktberechnung 
in zwei Schritte aufzuteilen: Im ersten Schritt, der idealerweise sehr schnell 
durchgeführt werden kann, bestimmt man, ob das Objekt überhaupt von dem 
Strahl geschnitten werden kann. Nur wenn dieser Test positiv ausfällt, wird im 
zweiten Schritt der genaue Schnittpunkt bestimmt. 


Es stellt sich die Frage, wie man durch einen einfachen Test feststellen kann, 
ob ein Objekt von einem Strahl geschnitten wird (ohne den Schnittpunkt wirk- 
lich zu berechnen). Das übliche Verfahren besteht darin, jedes Objekt mit 
einem sehr einfachen Volumen - dem umgebenden Volumen, englisch boun- 
ded volume - zu umgeben, das das Objekt vollständig enthält, vgl. [Whi80], 
[Gla89]. Ein Objekt kann nur dann von einem Strahl geschnitten werden, wenn 
auch das umgebende Volumen von dem Strahl geschnitten wird. Ob das Ob- 
jekt überhaupt von dem Strahl geschnitten werden kann, bestimmt man also 
durch eine Schnittpunktberechnung zwischen Strahl und umgebendem Volu- 
men. Diese Schnittpunktberechnung ist sehr schnell durchzuführen, weil das 
umgebende Volumen sehr einfach ist. Nur wenn der Strahl das umgebende Vo- 
Jumen schneidet, wird der Schnittpunkt mit dem eigentlichen Objekt bestimmt. 
Man beachte, daß es auch in diesem Fall einen solchen Schnittpunkt nicht ge- 
ben muß, weil das umgebende Volumen das Objekt normalerweise nicht eng 
umschließt. 


Der Erfolg dieses Verfahrens beruht darauf, daß für die meisten Objekte die 
Schnittpunktberechnung nach dem ersten Schritt abgebrochen werden kann, 
weil der Test normalerweise nur für sehr wenige Objekte positiv ausfällt. Man 
beachte, daß man in dem Fall, daß der Test positiv ausfällt, sogar mehr Rechen- 
zeit investiert als vorher, weil man eine zusätzliche Schnittpunktberechnung mit 
dem umgebenden Volumen durchgeführt hat. Dieser Mehraufwand wird aber 
von der durch die vielen negativen Testausgänge erreichte Einsparung bei wei- 
tem überwogen. In der Praxis ist die erreichte Laufzeiteinsparung erheblich. 


Die am häufigsten verwendeten umgebenden Volumen sind Kugel und Quader 
(auch Bor genannt). Der Grund liegt darin, daß der Schnittpunkt zwischen 
einem Strahl und einer Kugel oder einem Quader sehr einfach zu berechnen ist. 
Wir werden im folgenden die Schnittpunktberechnungen mit diesen Objekten 
näher untersuchen und abschließend einen Vergleich ziehen. 
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8.4.1 Kugeln als umgebendes Volumen 


Zur Berechnung des Schnittpunktes zwischen Strahl und Kugel gibt es meh- 
rere Möglichkeiten. Wir werden hier eine algebraische und eine geometrische 
Lösung vorstellen, siehe auch [Gla89]. Wir untersuchen beide Möglichkeiten, 
um zu zeigen, daß die naheliegende (algebraische) Lösung nicht unbedingt die 
effizienteste ist. 


8.4.1.1 Algebraische Lösung 
Die Parameterdarstellung eines Strahles lautet 


r(t)=erot+ttn mitt>0 


Dabei ist 70 = (£0,Y0,20) der Aufpunkt des Strahles und r, = (24,y4,24) ein 
normalisierter Richtungsvektor. Für Primärstrahlen ist bei perspektivischer 
Projektion 7, das Projektionszentrum, bei paralleler Projektion das betrachtete 
Pixel. Für Sekundärstrahlen ist der Aufpunkt der gefundene Schnittpunkt. Da 
rg normalisiert ist, gibt t den Abstand vom Aufpunkt an. 


Die Gleichung einer Kugeloberfläche mit Radius R und Mittelpunkt P, = 
(2c,Yc, 2.) ist definiert durch: 


(- 2) +Yy-Y)”+(z-2)”=R 


Dies ist eine implizite Darstellung, weil sie in dieser Form nicht geeignet ist, 
Punkte auf der Kugeloberfläche zu berechnen. Man kann sie nur benutzen, um 
festzustellen, ob ein Punkt auf der Kugeloberfläche liegt. 


Die Berechnung des Schnittpunkts zwischen Strahl und Kugel erhält man durch 
Einsetzen der Strahlgleichung in die Kugelgleichung: 


R? = (zo +txg _ 2)” + (Yo +Eya u Ye)” + (zo +tzq — 2.)” 
= (aa + ya +2) - 2 (zalee — zo) + Yalyc — Yo) + 2a(ze - 20)) + 
(2. - 20) + (ye- Yo) + (2. - 20)” 


Dabei ist 23+y3 +27 = 1, weil 74 normalisiert ist. Mit 


—2(zu(2.— Lo) + Yalye — Yo) + Zal2. — 20)) 
b = (n-H” +Ye-Y)+lz-2%)-R 


a 
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erhält man die quadratische Gleichung 


r+at+b=0 
die die beiden Lösungen 
hast (8.4) 
a a a’ | 


hat. Durch Einsetzen dieser Werte in die Strahlgleichung erhält man die Koor- 
dinaten der beiden Schnittpunkte $ı und 53 zwischen Strahl und Kugel: 


Sıa=tıafat fo 


Diese beiden Schnittpunkte existieren nur, wenn die Diskriminante der Wurzel 
in (8.4) > 0 ist, d.h. wenn a? > 4b. Wenn die Diskriminante = 0 ist, berührt 
der Strahl die Kugel und die beiden Schnittpunkte fallen zusammen. Wenn die 
Diskriminante < 0 ist, schneidet der Strahl die Kugel nicht. Wenn man die Ku- 
gel als umgebendes Volumen verwendet, kommt es nur darauf an, festzustellen, 
ob es einen Schnittpunkt gibt oder nicht. In diesem Fall braucht man nur die 
Diskriminante zu untersuchen, d.h. man muß bestimmen, ob a? < 4b ist. Wenn 
man den Wert R? vorberechnet, gemeinsame Unterausdrücke in den Formeln für 
a und b nur einmal berechnet und konstante Faktoren zusammenfaßt, braucht 
man für diesen Test acht Multiplikationen, acht Additionen/Subtraktionen und 
einen Vergleich. 


Wenn die Kugel das eigentliche Objekt ist, braucht man den Schnittpunkt, der 
am nächsten zum Aufpunkt liegt. Dieser wird durch den kleineren positiven 
der beiden errechneten Parameterwerte tı und t, bestimmt. Außerdem braucht 
man zur Berechnung der lokalen Farbwerte und zur eventuellen Berechnung 
von Reflexions- und Transmissionsstrahlen den Normalenvektor an der Stelle 
des gefundenen Schnittpunkts, vgl. Abschnitte 8.3 und 8.2. Der (normalisierte) 
Normalenvektor ri; im Punkt $; (i = 1,2) ist: 


Siehe auch Abbildung 8.11. 
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Abbildung 8.11: Der Normalenvek- 
tor für einen Punkt auf der Kugelo- 


berfläche. 





v Abbildung 8.12: Veranschaulichung 
= 0,7 der geometrischen Lösung: der Strahl 
Q/ schneidet die Kugel nur dann, wenn 
NA die Länge von g’kleiner oder gleich R 
4 N ist. 
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8.4.1.2 Geometrische Lösung 


Die geometrische Lösung stützt sich auf die Beobachtung, daß der Strahl die Ku- 
gel nicht schneiden kann, wenn der senkrechte Abstand des Kugelmittelpunkts 
P. vom Strahl r(t) größer ist als R ist, vgl. Abbildung 8.12. 


Sei Q der Punkt des Strahles, der von P. den kleinsten Abstand hat und sei g der 
Vektor, der P. mit Q verbindet. Es gilt also mit Verwendung der Ortsvektoren: 


+ n 


Q=entarna=P+g 


Um « zu bestimmen, bildet man auf beiden Seiten das Skalarprodukt mit r%: 
ta u=R rutg re 


Da r, normalisiert ist, gilt ra-ra = 1. Da g senkrecht zu 75 steht, gilt - 7, =0. 
Damit gilt: 


Zur Berechnung von «& braucht man also drei Multiplikationen und fünf Addı- 
tionen/Subtraktionen. Wenn «a < 0, zeigt der Strahl von der Kugel weg, d.h. es 
gibt keinen Schnittpunkt. Wenn & > 0, müssen wir die Länge von q mit R 
vergleichen. Um die Wurzelbildung zu vermeiden, vergleichen wir |9]? mit R?: 


= (Fo+a-ry— BR)? 
= (5 - PR) +2arı: (nm -P)+o? 72 
mm 


= (n-P)’-.o? 


Wenn q? > R?, schneidet der Strahl die Kugel nicht. Zur Berechnung von g? 
braucht man vier Multiplikationen und eine Subtraktion (P, — ro wurde bereits 
bei der Berechnung von «& berechnet). Zusammen mit der Berechnung von 
& braucht man also insgesamt sieben Multiplikationen und sechs Additionen. 
Wenn q? < R?, schneidet der Strahl die Kugel. Sei x der Abstand von Q zu den 
Schnittpunkten S, bzw. $3, vgl. Abbildung 8.13. Es ist also 2? = R? - q?. Für 
die beiden Schnittpunkte gilt: 


326 KAPITEL 8. RAY-TRACING-VERFAHREN 


Abbildung 

,_- 8.13: Veranschaulichung 
der Situation, in der der 
Strahl die Kugel schnei- 
det: Ö) liegt jetzt inner- 
5 N halb der Kugel und hat 

1 von den beiden Schnitt- 

_’ punkten 5} und 57 glei- 


7, chen Abstand x. 


SG = Q-ı n=nt+tla-r) rn 
% = tr ra=Htlaete)r 


Dies läßt sich wie folgt umformen: 


Sa = rt+tl(aFe)r 
= n+ (AR -n) a nFryR+a-(n-PB):r 
= ro+ [Tal&c — zo) + Yalyc — Yo) + Zal2e — 20)] ra 
For - [(zo - 2.)? + (yo - Ye)? + (20 - 2.)?] + R?- ra 


= r Im je b.r, 
= ro gar 1 d 


Man erhält also den gleichen Ausdruck wie bei der algebraischen Methode, die 
beiden Lösungen sind identisch, wenn es darum geht, die Schnittpunkte mit der 
Kugel zu bestimmen. Für die Anwendung als umgebendes Volumen, wo nur be- 
stimmt werden soll, ob der Strahl die Kugel schneidet, ist aber die geometrische 
Lösung besser geeignet, weil sie im Mittel weniger Operationen benötigt: Falls 
a < 0 ist, kann der Strahl die Kugel nicht schneiden und man kommt mit drei 
Multiplikationen und fünf Additionen aus. Falls & > 0 ıst, muß man zusätzlich 
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Abbildung 8.14: Eine Box 
kann mit Hilfe zweier Punkte 
(Imin, YUmin: Zmin) und (Zmazı 
Ymazı Zmaz) definiert werden, 
die die Ausdehnung der Box an- 
geben. 


(Imaz; Ymaz; Zmar) 





(Emin; Ymin Zmin) 


q? berechnen und braucht insgesamt sieben Multiplikationen und sechs Additio- 
nen. In beiden Fällen ist die geometrische der algebraischen Lösung, die immer 
acht Multiplikationen und acht Additionen braucht, überlegen. 


8.4.2 Boxen als umgebende Volumen 


Anstatt mit einer Kugel können wir ein Objekt auch mit einem Quader, auch 
Boz genannt, umgeben. Eine umgebende Box kann durch sechs Werte 


Imin, Tmaz , Ymin , Umaz , Zmin, Zmazr 


definiert werden, die die minimale und maximale Ausdehnung der Box in z-, y- 
und 2-Richtung angeben, vgl. Abbildung 8.14. Ob ein Strahl r(t) = ro+t-ry die 
Box schneidet, testet man am effizientesten mit dem Algorithmus von Cohen 
und Sutherland, den wir für das Clippen bzgl. des Einheitsvolumens angewendet 
haben, vgl. Abschnitte 2.4.1 und 3.7. 


Dieser Algorithmus ist eigentlich für das Clippen von Geradensegmenten mit 
einem Fenster bzw. einem Würfel gedacht, wobei die Geradensegmente durch 
ihre beiden Endpunkte spezifiziert sind. Um den Algorithmus im vorliegen- 
den Fall anzuwenden, müssen wir den Strahl als ein Geradensegment mit zwei 
Endpunkten darstellen. Als Endpunkte wählen wir den Aufpunkt und einen 
außerhalb der Szene liegenden Punkt auf dem Strahl. Der Algorithmus be- 
stimmt zuerst, ob beide Endpunkte ganz oberhalb, ganz unterhalb, ganz rechts, 
ganz links, ganz vor oder ganz hinter der Box liegen. Wenn dies der Fall ist, 
schneidet der Strahl die Box nicht. Wenn dies nicht erfüllt ist, wird der Strahl 
unterteilt in einen Teil, der außerhalb der Box liegt und einen Teil, der inner- 
halb der Box liegen kann. Dazu wählt man eine Begrenzungsebene der Box aus 
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und berechnet den Schnittpunkt des Strahlsegmentes mit dieser Ebene. Wenn 
der Schnittpunkt auf der Begrenzungsfläche der Box liegt, schneidet der Strahl 
die Box. Wenn der Schnittpunkt nicht auf der Begrenzungsfläche der Box liegt, 
wird der Endpunkt des Strahlsegmentes, der auf der Seite der Schnittebene 
liegt, auf der die Box nicht liegt, durch den Schnittpunkt mit der Ebene ersetzt 
und der Algorithmus wird rekursiv auf das neue Strahlsegment angewendet. Bei 
jedem rekursiven Aufruf wird eine andere Begrenzungsebene als Schnittebene 
ausgewählt. Das Verfahren bricht nach spätestens fünf Schitten ab, weil der 
Strahl mindestens zwei Seitenflächen der Box schneidet, wenn er die Box über- 
haupt schneidet. Wir wollen jetzt die Kosten der einzelnen Schnittberechnung 
untersuchen. Die sechs Begrenzungsebenen haben die folgenden Gleichungen: 


Y = Ymin Y” Ymar 
T = Imin T 7 Imaz 


zZ = Zmin 7 7 max 


Als Beispiel der Berechnung des Schnittpunktes zwischen dem Strahl und einer 
Begrenzungsebene betrachten wir die Ebene y = Ymin. Aus 


Yyo+t'Ya = Ymin 
ergibt sich t als 
_ Ymin — Yo 
Ya 


Den gesuchten Schnittpunkt $ = ($,, S,, $,) erhält man durch Einsetzen in die 
Strahlgleichung: 


t 


$= ro+ t- rı 
$ liegt auf der Begrenzungsfläche der Box, wenn gilt: 
Sr > Imin A Sr < Imaz N S2 > Zmin | S2 < Zmaz 


Der Aufwand für die Berechnung des Schnittpunkts zwischen Strahl und Be- 
grenzungsebene beträgt damit eine Division, zwei Multiplikationen (für die Be- 
rechnung von S, und S,) und drei Additionen/Subtraktionen. Ob der Schnitt- 
punkt auf der Begrenzungsfläche liegt, läßt sich mit maximal vier Vergleichen 
feststellen. Der vor der Schnittpunktberechnung durchgeführte Test, ob das 
Strahlsegment ganz auf einer Seite der Box liegt, kostet maximal sechs Ver- 
gleiche. Die genaue Gesamtanzahl der benötigten Operationen hängt von der 
Anzahl der rekursiven Aufrufe des Algorithmus ab. 
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8.4.3 Vergleich von Kugeln und Boxen als umgebende 
Volumen 


Beim Algorithmus von Cohen & Sutherland ist der zu Beginn jedes rekursiven 
Aufrufs durchgeführte Test, ob das Strahlsegment ganz auf einer Seite der Box 
liegt, für den ersten rekursiven Aufruf selten erfüllt. Dies liegt daran, daß das 
ursprüngliche Strahlsegment normalerweise recht lang ist, weil ein Endpunkt 
außerhalb der Szene gewählt wurde, d.h. in den meisten Fällen wird das Ver- 
fahren mindestens einmal durchlaufen. Dazu werden, vgl. oben, eine Division, 
zwei Multiplikationen, drei Additionen und zehn Vergleiche benötigt. In den sel- 
tensten Fällen wird aber die maximale Anzahl von fünf Durchläufen erforderlich 
sein. 


Der Vergleich von Kugeln und Boxen als umgebende Volumen ist natürlich auch 
davon abhängig, wie lange die Ausführung der einzelnen Grundoperationen (Di- 
vision, Multiplikation, Addition, Vergleich) auf dem zur Verfügung stehenden 
Rechner braucht, vgl. Anhang. Prinzipiell kann man aber feststellen, daß bei 
der Verwendung von Kugeln üblicherweise schneller bestimmt werden kann, ob 
es einen Schnittpunkt mit einem Strahl gibt. Wegen der großen Anzahl von 
Vergleichen beim Algorithmus von Cohen & Sutherland gilt dies insbesondere 
für die derzeit sehr verbreiteten RISC-Rechner, für die eine Floating-Point- 
Multiplikation oft genausoschnell ausgeführt werden kann wie ein Vergleich, 
siehe z.B. [Sun88]. Außerdem braucht die Ausführung einer Division auf den 
meisten Rechnern ein Vielfaches der Zeit einer Multiplikation oder Addition. 


Das heißt aber nicht unbedingt, daß man immer Kugeln als umgebende Vo- 
lumen verwenden sollte. Eine wichtige Rolle spielt auch die “Paßgenauigkeit” 
des umgebenden Volumens: Je enger das umgebende Volumen das eigentliche 
Objekt umgibt, desto sicherer ist die Aussage des Tests mit dem umgeben- 
den Volumen: Wenn das umgebende Volumen das eigentliche Objekt sehr lose 
umgibt, wird in einigen Fällen der Strahl das umgebende Volumen schneiden, 
obwohl es keinen Schnittpunkt mit dem eigentlichen Objekt gibt. In diesen 
Fällen wird die aufwendige Schnittpunktberechnung mit dem eigentlichen Ob- 
jekt unnötig ausgeführt. Unter diesem Aspekt ist z.B. eine Kugel als umge- 
bendes Volumen für einen langen, dünnen Stab schlecht geeignet. Eine besser 
passende, lange, schmale Box, die zwar eine aufwendigere Schnittpunktberech- 
nung zwischen Strahl und Volumen erfordert, dafür aber weniger Schnittpunkt- 
berechnungen mit dem eigentlichen Objekt nach sich zieht, wäre in diesem Fall 
wahrscheinlich besser geeignet. Für bestimmte Objekte kann es sogar sinnvoll 
sein, andere Volumen wie z.B. Ellipsoide, Zylinder oder Kegel als umgebende 
Volumen zu verwenden, wenn diese gut passen, siehe z.B. [Gla89]. 
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In [WHG84] wird als Kompromiß zwischen Paßgenauigkeit und Kosten der 
Schnittpunktberechnung eine heuristische Lösung vorgeschlagen, siehe auch 


[Gla89]: Man definiert die Paßgenauigkeit als 
Volumeninhalt des Originalobjektes 


Paßgenauigkeit = Volumen des umgebenden Volumen 
Man sucht für jedes Objekt o der Szene ein geeignetes umgebendes Volumen v,. 
Dazu definiert man: 

n : Anzahl der Strahlen, für die man testet, ob sie v, schneiden 

B(v.) : Kosten des Schnittpunkttests zwischen dem Strahl und v, 

m(v.) : Anzahl der Strahlen, die v, treffen 

I(0) : Kosten der Schnittpunktberechnung mit dem eigentlichen Objekt o 


Dann sind 


K(o,v,) =n:- B(v.) + m(v.)  I(o) 


die beim Ray-Tracing-Verfahren anfallenden Gesamtkosten für die Schnitt- 
punktberechnung mit Objekt o. n ist unabhängig von der Wahl von v, und 
ergibt sich aus Parametern wie der Auflösung des Bildschirms, der spezifizier- 
ten maximalen Tiefe des Strahlbaumes und den Gegebenheiten der Szene. /(o) 
ergibt sich aus der Definition von o. B(v,) läßt sich für ein umgebendes Volumen 
v. mit Hilfe ähnlicher Überlegungen wie den in den letzten beiden Abschnitten 
durchgeführten abschätzen. m(v,) kann z.B. anhand des Volumens von v, ab- 
geschätzt werden. Ein sehr einfaches v, resultiert in einem kleinen Wert von 
B(v.). Ein gut passendes v, resultiert in einem kleinen Wert von m(v,). Ziel 
ist es, durch geeignete Wahl von v, die Gesamtkosten K(o,v,) zu minimieren. 
Dazu kann man Verfahren der linearen Optimierung anwenden. 


8.4.4 Hierarchische umgebende Volumen 


Das bisher beschriebene Verfahren der umgebenden Volumen umschließt ein- 
zelne Objekte. Wenn der Schnittpunkt des Strahles mit dem Objekt berechnet 
werden soll, wird zuerst bestimmt, ob ein Schnittpunkt mit dem umgebenden 
Volumen existiert. Wenn dies nicht der Fall ist, braucht der Schnittpunkt mit 
dem eigentlichen Objekt nicht berechnet zu werden. Diese Methode reduziert 
also nicht die Anzahl der Schnittpunktberechnungen, sondern die Kosten für 
den einzelnen Schnittpunkttest. Vom theoretischen Standpunkt aus gesehen 
sind die Gesamtkosten für die Schnittpunktberechnung zwischen einem Strahl 
und den Objekten der Szene weiter linear in der Anzahl der Objekte. Die 
Laufzeit wird nur um einen konstanten Faktor reduziert. Bei der Methode der 
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hierarchischen umgebenden Volumen, die wir jetzt vorstellen wollen, vgl. auch 
[RW80] und [Gla89], reduziert sich dagegen auch die Anzahl der Schnittpunkt- 
berechnungen, und zwar bei geeigneter Hierarchiestruktur auf den Logarithmus 
der Anzahl der Objekte. 


Bei der Methode der hierarchischen umgebenden Volumen schließt man wei- 
terhin die einzelnen Objekte mit einem umgebenden Volumen ein. Darüber 
hinaus umschließt man aber auch Gruppen von Objekten mit einem größe- 
ren umgebenden Volumen, einzelne Gruppen umschließt man mit noch größe- 
ren umgebenden Volumen. Dieser Vorgang wird wiederholt, bis alle Objekte 
von einem einzigen großen Volumen eingeschlossen sind. Man kann die hier- 
archische Beziehung zwischen den einzelnen umgebenden Volumen durch einen 
Hierarchiebaum veranschaulichen, vgl. Abbildung 8.15. Bei der Suche nach den 
Objekten, die von einem Strahl geschnitten werden, wird der Hierarchiebaum 
von der Wurzel startend durchlaufen. Zuerst wird getestet, ob der Strahl das 
von der Wurzel repräsentierte Volumen schneidet. Wenn dies nicht der Fall 
ist, kann der Strahl keines der Objekte und keines der darunterliegenden umge- 
benden Volumen schneiden. Wenn das Wurzelvolumen geschnitten wird, wird 
der Schnittpunkttest für die Kinder der Wurzel wiederholt. Dieser Prozeß läuft 
evtl. weiter bis zu den Blattknoten. Der Vorteil des Verfahrens liegt darin, daß 
mit einem einzigen Schnittpunkttest evtl. für sehr viele Objekte ausgeschlossen 
werden kann, daß sie von dem Strahl geschnitten werden. 


Das beschriebene Verfahren legt es nahe, den Schnittpunkttest eines Strah- 
les mit den Objekten der Szene durch eine rekursive Prozedur zu realisieren, 


vgl. Abbildung 8.16. 


Für das Erstellen der Hierarchie der umgebenden Volumen gibt es zwei ver- 
schiedene Anzätze: In [RW80] wird vorgeschlagen, daß die Gruppenaufteilung 
interaktiv durch den Benutzer vorgenommen wird. In [GS87] wird ein Verfahren 
zur automatischen Erstellung der Hierarchie beschrieben. Dazu werden die Ob- 
jekte der Szene nacheinander in den (wachsenden) Hierarchiebaum eingefügt. 
Zum Einfügen eines Objektes mit seinem umgebenden Volumen startet man 
an der Wurzel des Hierarchiebaumes und entscheidet auf jeder Stufe, welches 
darunterliegende Kind-Volumen am wenigsten wächst, wenn das Objekt in den 
entsprechenden Unterbaum einsortiert wird. Zu diesem Kind wird das Objekt 
dann weitergereicht. 


Damit die Methode der hierarchischen umgebenden Volumen ın der Praxis einen 
merklichen Vorteil gegenüber der herkömmlichen Methode der umgebenden Vo- 
lumen bringt, müssen die Objekte der Szene gut zu Gruppen zusammenfaßbar 
sein. Es ist nicht sinnvoll, weit auseinander liegende Objekte zu einer Gruppe 
'zusammenzufassen und mit einem gemeinsamen umgebenden Volumen zu um- 
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Abbildung 8.15: Beispiel für die Anwendung der hierarchischen Volumen: die Ob- 
jekte sind durch ihre umgebenden Volumen als schattierte Boxen dargestellt, alle anderen 
umgebenden Volumen sind ebenfalls als Boxen dargestellt. Der Hierarchiebaum zu der 
dargestellten Hierarchie ist daneben abgebildet. 


geben, weil das umgebende Volumen dadurch so groß würde, daß viele Strahlen 
zwar das umgebende Volumen, aber keines der darin enthaltenen Objekte treffen 
würden. Deshalb sollten nur solche Objekte zu einer Gruppe zusammengefaßt 
werden, die nahe beieinander liegen. 


8.5 Adaptive Tiefenkontrolle 


Bisher haben wir dadurch für die Terminierung des Ray-Tracing-Verfahrens 
gesorgt, daß wir eine maximale Tiefe des Strahlbaumes festgelegt haben. Wenn 
diese maximale Tiefe erreicht ist, wird kein rekursiver Aufruf des Ray-Tracing- 
Verfahrens mehr gestartet. Für Szenen mit Objekten, die wenig reflektierend 
oder transparent sind, reicht eine geringe maximale Tiefe des Strahlbaumes 
aus, um eine realistische Darstellung zu erhalten. Für Szenen mit Objekten, 
die stark reflektierend oder transparent sind, muß die maximale Tiefe entspre- 
chend größer gewählt werden. Üblicherweise enthält eine Szene sowohl wenig 
als auch stark reflektierende oder transparente Objekte, wobei die Anzahl der 
stark reflektierenden oder transparenten Objekte oft recht gering ist. Um diese 
wenigen Objekte realistisch darzustellen, muß aber die Tiefe des Strahlbaumes 
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void hbv_iintersect (ray, node) 
RAY ray, NODE node; 
{ 
int i; 
if (is_leaf(node)){ 
if (bvintersect(ray, node.bv)) 
intersect(ray, node.object); 
} 


else 
if (bvintersect (ray, node.bv)) 
for (i=0; i<number_of_children(node); i++) do 
hbv_intersect (ray, child(i,node)) 


Abbildung 8.16: Skizze einer rekursiven Prozedur, die den Hierarchiebaum hinabsteigt. 
Die Datenstruktur NODE enthält außer den Baumverweisen zwei Einträge: NODE.objekt 
enthält die Spezifikation eines Objektes der Szene und ist nur für Blätter des Hierarchie- 
baumes besetzt, NODE.bv enthält die Spezifikation eines umgebenden Volumens und ist 
für alle Knoten besetzt. Die Prozedur bv_intersect(ray,bv) testet, ob der Strahl ray 
das umgebende Volumen bv trifft. Die Prozedur intersect(ray,object) berechnet 
den Schnittpunkt des Strahles ray mit dem Objekt object. 
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Abbildung 8.17: Veranschaulichung 
der Abschwächung der für die Strah- 
len errechneten Intensitäten: die 
für einen Strahl bestimmte Intensität 
wird um das Produkt der Koeffizi- 
enten auf dem Weg zu Wurzel ab- 
geschwächt. So wird z.B. die für 
den Strahl 4 errechnete Intensität um 
ks3 ' ksa - kıı abgeschwächt. 





entsprechend groß gewählt werden, was die Zeit für die Darstellung der Szene 
erheblich vergrößert. Für jedes Objekt, egal ob es wenig oder stark reflektierend 
oder transparent ist, werden so lange Strahlen abgespalten, bis die maximale 
Tiefe erreicht ist. Für die wenig reflektierenden oder transparenten Objekte 
wird ein großer Teil der Strahlen unnötig abgespalten, weil sie ab einer be- 
stimmten Tiefe keinen wahrnehmbaren Beitrag zur Intensität des betrachteten 
Pixels mehr leisten. 


Quantitativ läßt sich die Situation wie folgt beschreiben: Aus der Formel (8.3) 
für die Berechnung der Gesamtintensität, die von einem Punkt einer Oberfläche 
(entweder zum nächsten Punkt oder zum untersuchten Pixel) weitergegeben 
wird, ersieht man, daß die von den rekursiven Aufrufen für den reflektierten 
oder den transmittierten Strahl zurückgelieferten Intensitätswerte um den spie- 
gelnden Reflexionskoefhizienten k, bzw. den Transmissionskoeflizienten k, der 
zugehörigen Oberfläche abgeschwächt werden, bevor sie zu der lokalen Inten- 
sität addiert werden: 


Iges = Trokal + k; ‘ I, + kı ' I. 


Je weniger reflektierend bzw. transparent diese Oberfläche ist, umso größer ist 
die Abschwächung. Wie sehr der von einem rekursiven Aufruf berechnete In- 
tensitätswert bei der Berechnung der Intensität des betrachteten Pixels berück- 
sichtigt wird, ergibt sich als Produkt der Reflexions- bzw. Transmissionskoef- 
fizienten der dazwischenliegenden Oberflächen. Dies kann an dem zugehörigen 
Strahlbaum veranschaulicht werden, indem man jeder Kante (d.h. jedem Strahl) 
den Koefhizienten zuordnet, mit dem die Intensität des Kindknotens bei der Be- 
rechnung der Intensität des Vaterknotens multipliziert wird, vgl. Abbildung 


8.17. 


Die Technik der adaptiven Tiefenkontrolle, siehe [HG83] oder [Wat89], stützt 
sich auf die Beobachtung, daß die für einen Strahl errechnete Intensität kei- 
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nen wahrnehmbaren Beitrag zur Intensität des Pixels mehr leistet, wenn die 
Gesamt-Abschwächung des Strahls einen bestimmten Schwellenwert unter- 
schreitet. In diesem Fall braucht also die Intensität des Strahls gar nicht erst 
berechnet zu werden, folglich brauchen auch keine weiteren Strahlen ausgesandt 
zu werden. Es wird zwar weiterhin eine maximale Tiefe des Strahlenbaumes fest- 
gelegt, die ausgesandten Strahlen werden aber nur so lange zurückverfolgt, wie 
sie einen wahrnehmbaren Beitrag zur Intensität des betrachteten Pixels lei- 
sten können. Abbildung 8.18 zeigt eine Programmskizze. Mit der Technik der 
adaptiven Tiefenkontrolle kann die Anzahl der ausgesandten Strahlen erheb- 
lich reduziert werden. Für Szenen, in denen wenige, stark reflektierende oder 
transparente Objekte und viele, kaum reflektierende oder transparente Objekte 
liegen, ist eine Reduzierung der ausgesandten Strahlen um einen Faktor 10 keine 
Seltenheit. Da die Technik auch sehr einfach zu implementieren ist, sollte sie in 
keiner Implementierung des Ray-Tracing-Verfahrens fehlen. 


8.6 Unterteilung des Raumes 


Bei der Methode der hierarchischen umgebenden Volumen werden zuerst ein- 
zelne Objekte, dann immer größere Gruppen von Objekten mit einfachen Vo- 
lumen umgeben, die resultierende Hierarchie der umgebenden Volumen wird 
in einem Hierarchiebaum angeordnet, der bottom-up aufgebaut wird, d.h. von 
den Blättern beginnend und zu der Wurzel fortschreitend. Bei der Suche nach 
dem Schnittpunkt eines Suchstrahls mit dem am nächsten zum Aufpunkt lie- 
genden Objekt wird der Hierarchiebaum top-down durchlaufen, d.h. bei der 
Wurzel beginnend und zu den Blättern fortschreitend. Für einen inneren Kno- 
ten wird für alle darunterliegenden Objekte der gesuchte Schnittpunkt dadurch 
bestimmt, daß der Schnittpunkt rekursiv für alle Kinder berechnet wird. Un- 
ter den für die Kinder bestimmten Schnittpunkten wird derjenige ausgesucht, 
der am nächsten zum Aufpunkt des Strahls liegt. Die Methode der hierarchi- 
schen umgebenden Volumen ist also ein divide-and-conquer-Ansatz, wobei die 
Aufteilung sich an den Objekten und ihren umgebenden Volumen orientiert. 
Die in diesem Abschnitt vorgestellte Methode der Unterteilung des Raumes, 
vgl. [Gla84] und [Gla89], ist ebenfalls ein divide-and-conquer-Ansatz. Die Idee 
besteht darin, den Raum, der die darzustellende Szene enthält, rekursiv in Re- 
gionen aufzuteilen. Der die Aufteilung darstellende Baum wird also top-down 
aufgebaut. Die Aufteilung erfolgt unabhängig von der Lage der Objekte. Jeder 
Region werden die Objekte zugeordnet, die ganz oder teilweise darin enthalten 
sind. Wie wir gleich sehen werden, wird der die Aufteilung darstellende Baum 
bei der Suche nach dem Schnittpunkt eines Suchstrahls mit dem am nächsten 
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float trace (r, depth, cum weight) 
RAY r; int depth; float cum weight; 


POINT s; 
RAY refl,trns; 
float Iloc,I_ref,Itrn,k s,kt; 


if (cum weight < min weight) return BLACK; 
else if (depth > max_depth) return BLACK; 
else if ((s = intersect(r)) == NULL) return BACKGROUND; 
if (is_illuminated(s)) 

I_loc = computelloc(s); 
else I_loc = BLACK; 
k_s = get _refl_koeff(s); 
k_t = get_trans_koeff(s); 
refl = compute_ reflection ray (r,s); 
I_ref = trace(refl,depth+1,cum weight * k_s); 
trns = compute transmission ray (r,s); 
I_trn = trace(trns,depth+i1,cum weight * k_t); 
return combine(I_loc,I_ref,I_trn); 





Abbildung 8.18: Programmskizze zur Methode der adaptiven Tiefenkontrolle: Der Pa- 
rameter cum_weight gibt an, mit welchem Gewicht die von dem momentanen Aufruf 
der Prozedur trace zurückgelieferte Intensität bei der Berechnung des Wurzelaufrufs, 
d.h. bei der Berechnung der Pixelintensität berücksichtigt wird. Wenn cum_weight einen 
bestimmten Minimalwert min weight unterschreitet, wird der rekursive Aufruf abgebro- 
chen. Bei einem neuen rekursiven Aufruf wird der neue Wert des Parameters cum weight 
durch Multiplikation mit dem spiegelnden Reflexionskoeffizienten bzw. mit dem Transmis- 
sionskoeffizienten berechnet. Diese werden durch die Funktionen get_refl_koeff(s) 
bzw. get_trans _koeff(s) zurückgeliefert. Da diese Koeffizienten immer Werte kleiner 
als 1 haben, wird der Wert von cum weight bei jedem rekursiven Aufruf kleiner. Die ande- 
ren verwendeten Funktionen sind bereits in den vorangehenden Programmskizzen erklärt. 
Man beachte, daß auch hier die einfache Optimierung durchgeführt werden kann, die wir 
auf den Grundalgorithmus angewendet haben: Man kann die Abbruchbedingung an die 
Aufrufstelle verschieben und spart dadurch den untersten rekursiven Aufruf mitsamt der 
Berechnung von reflektiertem und transmittiertem Strahl. 
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zum Aufpunkt liegenden Objekt bottom-up durchlaufen. Verglichen mit der 
Methode der hierarchischen umgebenden Volumen haben sich also sowohl die 
Aufbaurichtung des Baumes als auch die Suchrichtung nach einem Schnittpunkt 
umgedreht. Wir werden jetzt das Verfahren etwas ausführlicher beschreiben. 


Ein grundlegender Begriff bei der Methode der Raumunterteilung ist der Begriff 
des Voxels (für volume element). Ein Voxel ist ein quaderförmiges Raumele- 
ment, das bei der rekursiven Unterteilung des Raumes entsteht und das nicht 
weiter unterteilt wird. Aus dem Prozeß der rekursiven Unterteilung des Raumes 
ergibt sich, daß die Voxel sich nicht überlappen und daß die Vereinigung aller 
Voxel den Raumbereich aufspannen, den die gegebene Szene einnimmt. Die 
verschiedenen Varianten der Methode der Raumunterteilung unterscheiden sich 
vor allem darin, wie die Voxel definiert werden. Man kann zwei Hauptgruppen 
der Raumunterteilungs-Algorithmen unterscheiden: Algorithmen, die mit Vo- 
xel gleicher Größe arbeiten, und Algorithmen, die mit Voxel unterschiedlicher 
Größe arbeiten. Wir gehen weiter unten auf die wesentlichen Unterschiede ein. 
Wenn die Voxel einmal definiert sind, spielen sie in allen Varianten des Verfah- 
rens die gleiche Rolle: sie dienen dazu, die Anzahl der Objekte, die von einem 
Suchstrahl geschnitten werden können, einzuschränken, um so die Anzahl der 
Objekte zu reduzieren, mit denen ein Schnittpunkt berechnet werden muß. 


Bei der Suche nach dem Objekt, dessen Schnittpunkt mit dem Suchstrahl am 
nächsten zum Aufpunkt liegt, startet das Verfahren der Raumunterteilung mit 
dem Voxel, das den Aufpunkt des Strahls enthält. Wenn dieses Voxel ein oder 
mehrere Objekte enthält, wird untersucht, ob der Strahl eines dieser Objekte 
schneidet. Wenn dies der Fall ist, hat man den gesuchten Schnittpunkt gefun- 
den. Wenn dies nicht der Fall ist, muß das Voxel untersucht werden, das der 
Strahl als nächstes durchläuft. Das Verfahren bricht ab, wenn ein Schnittpunkt 
gefunden ist oder wenn der Strahl die Szene verläßt. Der Vorteil des Verfahrens 
liegt darin, daß nur die Voxel untersucht werden, durch die der Strahl verläuft. 
Alle Objekte in Voxeln, die nicht von dem Strahl geschnitten werden, brauchen 
nicht untersucht zu werden. Außerdem werden die Voxel in der Reihenfolge 
untersucht, in der sie vom Strahl durchlaufen werden. Sobald der Schnittpunkt 
mit einem Objekt gefunden ist, brauchen nur noch die Objekte in dem vorlie- 
genden Voxel untersucht zu werden. Alle anderen Objekte, auch solche, die in 
Voxel liegen, die später noch von dem Strahl geschnitten werden, spielen keine 
Rolle mehr”. Man kann die Situation auch wie folgt darstellen: Durch das 
Bilden der Voxel und das Zuordnen von Objekten zu den Voxel hat man eine 
Vorsortierung der Objekte durchgeführt. Beim Überprüfen, welche Objekte ein 
Strahl schneidet, greift man auf diese Vorsortierung zurück und spart sich dabei 


2Siehe Abschnitt 8.6.3 für eine Einschränkung dieser Aussage. 
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das Sortieren der geschnittenen Objekte nach dem Abstand vom Aufpunkt des 
Strahls. | 


Es bleibt die Frage zu klären, wie man die Voxel in der Reihenfolge, in der 
sie vom Strahl getroffen werden, findet. Die Beantwortung dieser Frage ist 
abhängig von der Definition der Voxel und der Datenstruktur, in der sie abgelegt 
sind. Wir werden in den folgenden beiden Abschnitten diese Frage für Voxel 
gleicher Größe und Voxel unterschiedlicher Größe beantworten und dabei auch 
auf Datenstrukuren für die Ablage der Voxel eingehen. 


8.6.1 Nicht-uniforme Raumunterteilung 


Bei der Methode der nicht-uniformen Raumunterteilung können die Voxel un- 
terschiedliche Größe haben. Dadurch kann man die Größe der Voxel den Ge- 
gebenheiten der Szene anpassen, d.h. man kann in Gebieten, in denen viele 
Objekte liegen, kleinere Voxel verwenden als in Gebieten, in denen wenige Ob- 
jekte liegen. Eine häufig verwendete Datenstruktur zur Ablage der Voxel bei 
der nicht-uniformen Raumunterteilung ist der Octree, vgl. [Gla84] und [Gla89]. 
Einen Octree haben wir bereits bei der Auswahl der Farbwerte für die Farbta- 
belle benutzt, siehe Abschnitt 2.6.2.4. Hier repräsentieren die Knoten des Octree 
quaderförmige Raumbereiche. Der Octree wird aufgebaut, indem man, startend 
mit einem Raumbereich, der die darzustellende Szene vollständig enthält, den 
durch einen Knoten dargestellten Raumbereich durch Halbierung seiner Kanten 
in acht gleichgroße Unterbereiche unterteilt und das Verfahren rekursiv auf die 
so entstehenden Unterbereiche anwendet. Jedem Raumbereich werden die in 
ihm ganz oder teilweise enthaltenen Objekte zugeordnet. Wenn ein entstehen- 
der Raumbereich weniger als eine vorgegebene Anzahl von Objekten ganz oder 
teilweise enthält, wird er nicht weiter unterteilt. Ein zweidimensionales Beispiel 
ist in Abbildung 8.19 wiedergegeben. Nähere Einzelheiten zur Implementierung 
des Octree-Aufbaus findet man in [Gla84]. Ein Octree wird für eine Szene genau 
einmal aufgebaut. Danach werden alle Schnittpunkte von Strahlen mit Objek- 
ten mit Hilfe desselben Octrees bestimmt. Es können sogar unterschiedliche 
Perspektiven einer Szene ohne Änderung des Octrees dargestellt werden. 


Um den Schnittpunkt eines Strahls mit dem Objekt zu finden, das am nächsten 
zum Aufpunkt liegt, muß man zuerst wissen, in welchem Voxel der Aufpunkt 
liegt. Dieses Voxel findet man durch einen Top-down-Lauf über den Octree, 
wobei auf jeder Stufe drei Vergleiche durchgeführt werden, um festzustellen, in 
welchem Kind-Raumelement der Aufpunkt liegt. Der Aufpunkt liegt in dem 
Voxel, in dem diese Suche endet. Die Laufzeit für diese Suche ist proportio- 
nal zu der Tiefe des Octrees. Diese ist i.a. sehr gering: zum Beispiel hat ein 
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Abbildung 8.19: Veranschaulichung der Anwendung der Methode der nicht-uniformen 
Raumunterteilung im zweidimensionalen Fall. Die rekursive Unterteilung der Raumberei- 
che stoppt, wenn jedes erzeugte Raumelement höchstens ein Objekt enthält. Im zwei- 
dimensionalen Fall ıst die zugehörige Datenstruktur ein Quadtree, kein Octree. Der zur 
dargestellten Szene gehörende Quadtree ist rechts abgebildet. Die vier Kinder eines Kno- 
tens repräsentieren die Unterteilung des zu dem Knoten gehörenden Raumbereiches in 
vier Unterbereiche. Das linkeste Kind repräsentiert den Bereich links oben, das zweite 
Kind den rechts danebenliegenden Bereich, das dritte Kind den linken unteren Bereich, 


das rechteste Kind den Bereich rechts unten. 
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vollständiger Octree für 1024? Voxel die Tiefe log,(1024°) = 10. 


Wenn das Voxel, in dem der Aufpunkt liegt, Objekte enthält, testet man diese 
Objekte auf Schnittpunkte mit dem Strahl. Wenn der Strahl eines der Ob- 
jekte schneidet, hat man den gesuchten Schnittpunkt gefunden. Wenn das 
Voxel keine Objekte enthält oder wenn keines der enthaltenen Objekte vom 
Strahl geschnitten wird, muß man das nächste Voxel suchen, das der Strahl 
durchläuft. Das prinzipielle Verfahren dazu besteht darin, einen Punkt zu fin- 
den, der garantiert in dem Nachbarvoxel liegt. Das zugehörige Nachbarvoxel 
findet man dann wieder durch einen Top-down-Lauf über den Octree, diesmal 
mit dem gefundenen Punkt. Den gesuchten Punkt findet man wie folgt: Man 
berechnet den Schnittpunkt des Strahls mit den Begrenzungsflächen des aktu- 
ellen Voxels. Von diesem Schnittpunkt aus geht man man ein kleines Stück 
in Richtung des Nachbarvoxels, um einen Punkt in diesem zu erhalten. Da 
die Voxel unterschiedliche Ausdehnung haben können, muß man aufpassen, daß 
man nicht über die Ausdehnung des Nachbarvoxels hinausläuft. Dies stellt 
man wie folgt sicher: Man merkt sich die Ausdehnung des kleinsten Voxels 
im Öctree, diese sei min_length. Wenn der Schnittpunkt innerhalb einer der 
Begrenzungsflächen des Voxels liegt, geht man min_length/2 Längeneinheiten 
in Richtung des Nachbarvoxels. Wenn der Schnittpunkt auf einer Kante oder 
einer Ecke des Voxels liegt, geht man zuerst min_length/2 Längeneinheiten 
in Richtung des Inneren der Begrenzungsfläche und erst dann min_length/2 
Längeneinheiten in Richtung des Nachbarvoxels. Damit ist man sicher, einen 
Punkt im Inneren des Nachbarvoxels gefunden zu haben. Das zugehörige Vo- 
xel, in dem dieser Punkt liegt, erhält man wieder durch einen Top-down-Lauf 
über den Octree. Eine Programmskizze der beschriebenen Suche ist in Abbil- 
dung 8.20 wiedergegeben. Eine Verbesserung der Suche nach dem zugehörigen 
Voxel erreicht man durch folgendes Vorgehen: Man läuft vom Octree-Eintrag 
des Vorgängervoxels bottom-up so weit nach oben, bis man ein Raumelement 
erreicht hat, in dem der gefundene Punkt liegt. Dann läuft man wieder nach 
unten und sucht den Voxeleintrag. In den meisten Fällen liegen die Octree- 
Einträge der beiden Voxel nahe beieinander und man braucht nur ein kleines 
Stück nach oben zu laufen. 


Mit der beschriebenen Raumaufteilungs-Methode können sehr große Einspa- 
rungen in der Laufzeit des Ray-Tracing-Verfahrens erreicht werden. In [Gla84] 
werden Einsparungen gegenüber dem Grundalgorithmus um Faktor 4 bis 30 
berichtet, wobei die Einsparung mit der Dichte und der Komplexität der dar- 
zustellenden Szene zunimmt. Man beachte, daß die Methode der (nicht hier- 
archischen) umgebenden Volumen zusätzlich angewendet werden kann, um für 
komplizierte Objekte die Schnittpunktberechnung möglichst zu vermeiden. 


Eine allgemeinere Datenstruktur als ein Octree, die ebenfalls zur Ablage der 
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POINT octree_intersect (r,t) 
RAY r; OCTREE t; 
{ 
POINT s,s_.nearest,p; 
VOXEL v; 
OBJECT o; 


s_nearest = NULL; 
p = r.origin; 
do { 
v = find voxel(p,t); 
for (each object o in v) { 
if ((s = intersect_object(r,0o)) != NULL) { 
if (is. nearer(s,s nearest,r.origin) 
s_nearest = s; 
} 


} 


if (s_nearest == NULL) 
p = neighbor point(v,r); 
} while ((s.nearest == NULL) && !outside(t,p)) 
return s_nearest; 


} 





Abbildung 8.20: Programmskizze der Suche nach dem am nächsten zum Aufpunkt 
r.origin des Strahls r gelegenen Schnittpunktes s.nearest. find_voxel(p,t) sucht 
das Voxel im Octree t, das den Punkt p enthält. intersect_object(r,o) berechnet 
den Schnittpunkt des Strahls r mit dem Objekt o. is nearer(s,s nearest,r.origin) 
testet, ob s näher zum Aufpunkt r.origin des Strahls liegt als s_nearest. 
neighbor point(v,r) berechnet einen Punkt p auf dem Strahl r, der in dem Voxel 
liegt, das r als nächstes durchläuft. outside(t,p) testet, ob der Punkt p außerhalb 
der vom Octree t erfaßten Szene liegt. Die do-Schleife stoppt, wenn ein Schnittpunkt 
gefunden ist oder wenn der Strahl die Szene verlassen hat. 
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Abbildung 8.21: Darstellung einer Raumbereichsunterteilung durch Quadtree und BSP- 
Baum im zweidimensionalen Fall. Im zweidimensionalen Fall sind die Aufteilungsebenen 
Geraden. In dem dargestellten Beispiel werden die beiden Geraden z = cı und y = ca ver- 
wendet, wobei cı und ca Konstanten sind. Zur Verdeutlichung sind zu den inneren Knoten 
des BSP-Baums die zugehörigen Aufteilungsebenen angegeben. Die Verallgemeinerung 
auf den dreidimensionalen Fall bereitet keine Probleme. 


Voxel eingesetzt werden kann, ist der BSP-Baum (BSP steht für binary space 
partitioning), vgl. [Gla89] und [Wat89]. Ein BSP-Baum ist ein binärer Baum, 
dessen innere Knoten wie beim Octree quaderförmige Raumbereiche repräsen- 
tieren. Zusätzlich wird aber für jeden Knoten eine Aufteilungsebene spezifiziert, 
aus der die Raumbereiche für die Kinder berechnet werden. Die Aufteilungs- 
ebene eines Knoten muß dessen Raumbereich nicht in gleiche Teile zerlegen, die 
Raumbereiche für die Kinder können also unterschiedlich groß sein. 


Jeder Octree läßt sich als BSP-Baum darstellen, vgl. Abbildung 8.21. Man 
kann den BSP-Baum beim Verfahren der nicht-uniformen Raumunterteilung 
also einfach als eine alternative Datenstruktur für den Octree einsetzen. Der 
BSP-Baum bietet aber darüber hinaus die Möglichkeit, andere Aufteilungen 
für die Raumelemente zu benutzen als die oben beschriebene Aufteilung in 
gleichgroße Unterbereiche. Die Lage der Aufteilungsebenen kann so der Lage der 
Objekte angepaßt werden. Man kann also auch bei Szenen mit ungleichmäßiger 
Verteilung der Objekte die Aufteilungsebenen so plazieren, daß der entstehende 
BSP-Baum eine gute Balancierung aufweist. Dies hat den Vorteil, daß die Suche 
nach dem zu einem Punkt gehörenden Voxel im Mittel weniger Zeit braucht. Die 
Abbildungen 8.22 und 8.23 veranschaulichen die sich bietenden Möglichkeiten 
wieder an einem Beispiel im zweidimensionalen Raum. 
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Abbildung 8.22: Anwendung der Me- 
thode der nicht-uniformen Raumaufteilung 
im zweidimensionalen Fall. Die darzustel- 
lende Szene enthält die Objekte a bis p, die 
wie dargestellt verteilt seien. Die ursprüng- 
liche Unterteilungsmethode in gleichgroße 
Teile führt zu der eingezeichneten Auftei- 
lung, bei der die entstehenden Voxel sehr un- 
terschiedliche Größe haben. Der zugehörige 
Quadtree (rechts oben) zeigt deswegen auch 
eine ungleichmäßige Struktur. Dies wird ins- 
I\ A besondere an der Darstellung als BSP-Baum 
abdec fghi Iyjykm klar, der Tiefe 8 hat. 
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Abbildung 8.23: Die Verwendung eines BSP-Baums gestattet eine flexiblere Plazierung 
der Aufteilungsebenen und damit eine gleichmäßigere Verteilung. In diesem Beispiel wur- 
den die Aufteilungsebenen so gelegt, daß auf beiden Seiten der Ebene jeweils gleichviele 
Objekte liegen. Die Aufteilungsebenen sind mit Nummern versehen, auf die an den inne- 
ren Knoten des BSP-Baums verwiesen wird. Den Vorteil der flexiblen Plazierung erkennt 
man an dem zugehörigen BSP-Baum, der mit Tiefe vier eine deutlich geringere Tiefe als 
der BSP-Baum aus Abbildung 8.22 und eine sehr gleichmäßige Balancierung aufweist. 
Dies führt dazu, daß die Bestimmung des Voxels zu einem gegebenen Punkt im Mittel 
schneller durchgeführt werden kann. 
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8.6.2 Uniforme Raumaufteilung 


Bei der Methode der uniformen Raumaufteilung, vgl. [FTI86], [Gla89], haben 
alle Voxel die gleiche Größe. Die Voxel entstehen durch eine regelmäßige Un- 
terteilung des Raumelementes, das die Szene enthält, und werden in einem 
dreidimensionalen Gitter abgelegt. Ebenso wie bei der nicht-uniformen Raum- 
aufteilung hält man zu jedem Voxel eine Liste der Objekte, die ganz oder teil- 
weise in diesem liegen. Bei der Suche nach dem am nächsten zum Aufpunkt 
liegenden Schnittpunkt eines Strahls mit den Objekten der Szene werden die 
Voxel wieder in der Reihenfolge durchsucht, in der sie von dem Strahl durchlau- 
fen werden, beginnend mit dem Voxel, das den Aufpunkt enthält. Abbildung 
8.24 zeigt eine Programmskizze dieser Schnittpunktberechnung. 


Die inkrementelle Berechnung des nächsten vom Strahl durchlaufenen Voxels 
kann mit einer Variante des Bresenham-Algorithmus erfolgen, den wir für die 
Rasterung von Geradensegmenten verwendet haben, siehe Abschnitt 2.1.2. Im 
Gegensatz zum Bresenham-Algorithmus, bei dem die Pixel bestimmt werden, 
die der zu zeichnenden Gerade am nächsten liegen, müssen hier alle Voxel ge- 
funden werden, die der Strahl schneidet (siehe Abbildung 8.25). Dies erreicht 
man durch eine leichte Veränderung des Bresenham-Algorithmus, die für den 
zweidimensionalen Fall in Abbildung 8.26 wiedergegeben ist. Für die Anwen- 
dung im dreidimensionalen Gitter muß diese Variante auf den dreidimensionalen 
Fall verallgemeinert werden. Dies ist zwar etwas umständlich, aber nicht wei- 
ter schwierig: Man legt die Parameterdarstellung r(t) = ro + t : ra zugrunde 
und verwendet als treibende Achse die Koordinatenrichtung mit der kleinsten 
absoluten Steigung in t, dies sei z.B. die z-Achse. für die beiden anderen Rich- 
tungen benutzt man Variablen error _y und error z, die den Fehler bzgl. dieser 
Richtungen angeben. 


Die uniforme Raumaufteilung hat im Vergleich mit der nicht-uniformen Raum- 
aufteilung den Nachteil, daß die Unterteilung vollkommen unabhängig von der 
Lage der Objekte ist und daß die Voxelunterteilung nicht beliebig fein sein kann, 
weil sonst zu viel Speicherplatz verbraucht wird? und weil es bei einer feinen 
Unterteilung teuer wird, einen Strahl durch leere Raumbereiche zu verfolgen. 
In Raumbereichen, in denen viele Objekte dicht beieinander liegen, kann ein 
Voxel daher recht viele Objekte enthalten. Wenn ein Strahl ein solches Voxel 
durchläuft, müssen die Schnittpunkte mit allen diesen Objekten berechnet wer- 
den. Der Vorteil der uniformen Raumaufteilung liegt darin, daß die vom Strahl 
durchlaufenen Voxel bei Verwendung des modifizierten Bresenham-Algorithmus 


3Schon bei einer Rasterung von 100 pro Koordinatenrichtung müssen eine Million Voxel 
abgespeichert werden, wobei zu jedem Voxel eine Liste der ganz oder teilweise enthaltenen 
Objekte gespeichert werden muß. 
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POINT grid_intersect(r,g) 
RAY r; 3D_GRID g; 


VOXEL v; OBJECT o; 
POINT s,s_nearest; 


v = find grid voxel(r.origin,g); 
s_nearest = NULL; 
do { 


for (each object o in v) { 
if ((s = intersect_object(r,0)) != NULL) { 
if (is .nearer(s,s nearest,r.origin) 
s_nearest = S; 


} 


if (s_.nearest == NULL) v = next_voxel(v,r,g); 
} while ((s.nearest == NULL) && (v != NULL)) 
return s_nearest; 


} 





Abbildung 8.24: Programmskizze der Suche nach dem am nächsten zum Aufpunkt 
r.origin des Strahls r gelegenen Schnittpunktes s_.nearest bei der Methode der 
uniformen Raumaufteilung. 3D_GRID ist im wesentlichen ein dreidimensionales Feld, 
dessen Einträge vom Typ VOXEL sind. Ein Voxel kann demnach durch 3 Zahlen 
(i,j,k) spezifiziert werden, die die Koordinaten in dem dreidimensionales Feld ange- 
ben. find grid_voxel(r.origin,g) berechnet das in g abgelegte Voxel, das den 
Aufpunkt r.origin enthält. next_voxel(v,r,g) liefert das nächste in g abgelegte 
Voxel, das vom Strahl r durchlaufen wird. Dazu kann eine Variante des Bresenham- 
Algorithmus verwendet werden, vgl. Abbildung 8.25. next_voxel liefert NULL, wenn 
der Strahl die Szene verlassen hat. Die anderen verwendeten Funktionen sind bereits in 
Abbildung 8.20 beschrieben. 
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Abbildung 8.25: Modifikation des 
Bresenham-Algorithmus für den Ein- 
satz bei der Methode der unifor- 
men Raumunterteilung. Die mit 
&) gekennzeichneten Pixel müssen 
zusätzlich zu den vom ursprüngli- 
chen Bresenham-Algorithmus gesetz- 
ten Pixeln dargestellt werden, der die 
mit e gekennzeichneten Pixel setzt. 
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wesentlich schneller berechnet werden können als bei der Verwendung eines Oc- 
trees (in [FTI86] wird Faktor 13 genannt). Damit die Methode der uniformen 
Raumaufteilung schneller ist als die Methode der nicht-uniformen Raumauftei- 
lung, muß dieser Vorteil den zuerst genannten Nachteil überwiegen. Dies ist 
beispielsweise für Szenen der Fall, in denen die Objekte gleichmäßig verteilt 
sind oder für Szenen, in denen die Objekte so weit auseinander liegen, daß das 
Durchlaufen der von einem Strahl getroffenen Voxel zur dominanten Operation 
wird. Für dichbesetzte Szenen, in denen die Objekte sehr ungleichmäßig verteilt 
sind, ist dagegen die Methode der nicht-uniformen Raumaufteilung überlegen. 


8.6.3 Mögliche Ineffizienzen und Fehler 


Bei beiden beschriebenen Methoden der Raumaufteilung wird für jedes Voxel 
eine Liste der Objekte gehalten, die ganz oder teilweise innerhalb des Voxels lie- 
gen. Ein Objekt kann mehreren Voxeln zugeordnet sein. Deshalb ist es möglich, 
daß man den Schnittpunkt eines Strahls mit demselben Objekt mehrfach berech- 
net, vgl. [Gla89]. Das geschieht dann, wenn der Strahl das betreffende Objekt 
nicht schneidet, aber mehrere Voxel durchläuft, denen dieses Objekt zugeord- 
net ist. In Abbildung 8.28 liegt für das Objekt A eine solche Situation vor. Da 
die Berechnung des Schnittpunkts mit einem Objekt je nach Komplexität des 
Objektes zeitaufwendig sein kann, versucht man diese unnötigen Schnittpunkt- 
berechnungen zu vermeiden. Eine mögliche Abhilfe besteht darin, zu jedem 
Objekt ein Bit zü halten, das angibt, ob der Schnittpunkt zwischen dem Ob- 
jekt und dem momentanen Strahl schon berechnet wurde. Wenn das Bit gesetzt 
wird, wird auch der gefundene Schnittpunkt abgespeichert. Ein Schnittpunkt 
mit einem Objekt wird nur dann berechnet, wenn dessen Bit noch nicht gesetzt 
ist. Bevor der nächste Strahl bearbeitet wird, müssen bei dieser Lösung die Bits 
aller Objekte zurückgesetzt werden. Eine andere Lösung besteht darin, jedem 
Strahl eine eindeutige Nummer zuzuordnen. Zu jedem Objekt wird statt einem 
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void bres mod(xi,yi,xn,yn,value) 
int x1,yil,xn,yn,value; 


{ 


int error,errori,x,y,dx,dy; 


dx =xn - xl; 

dy=yn-yl; 

error = -dx/2; 

y-yl; 

for (x=x1; x <= xn; x++) { 
set pixel(x,y,value); 


error = error + dy; 

if (error >= 0) { 
errori = error - dy/2 
if (errori < 0) set pixel(x+1,y,value); 
y+t+; error = error - dx; 

} 

else { 

e errori = error + dy/2; 

e if (errori >= 0) set _pixel(x+1,y+1,value); 





Abbildung 8.26: Variante des Bresenham-Algorithmus, vgl. Abbildung 2.5, die alle 
Pixel setzt, die von einer zwischen (x1,y1) und (xn,yn) verlaufenden Linie getroffen 
werden. Die abgebildete Variante nimmt die x-Achse als treibende Achse und positive 
Steigung an. Die allgemeine Form kann wie in Abschnitt 2.1.2 beschrieben erhalten 
werden. Die mit e bezeichneten Zeilen sind zu der dort angegebenen Basisvariante hin- 
zugekommen, vgl. Abbildung 2.5. Die Bedeutung der Variablen error und errori ist in 
Abbildung 8.27 veranschaulicht. 
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Abbildung 8.27: Bedeutung von errori. Wenn error >= 0 ist, dient errori dazu 
festzustellen, ob das unterhalb des normalerweise gesetzten Pixels liegende Pixel vom 
Strahl getroffen wird. Wenn error < 0 ist, dient errori dazu festzustellen, ob das 
oberhalb des normalerweise gesetzten Pixels liegende Pixel vom Strahl getroffen wird. 


Strahl | 





Abbildung 8.28: Eine kritische Szene für die Methoden der Raumaufteilung: Der einge- 
zeichnete Strahl durchläuft nacheinander die Voxel 1 bis 8. Der Schnittpunkt des Strahls 
für Objekt A wird für Voxel 1 und 2 berechnet, weil A diesen beiden Voxel zugeordnet 
ist. Objekt B ist den Voxeln 4, 5 und 6 zugeordnet. Von diesen wird Voxel 4 als erstes 
von dem Strahl durchlaufen. Bei der Untersuchung von Voxel 4 wird der Schnittpunkt 
$, mit Objekt B gefunden. Da sonst kein Objekt in Voxel 4 liegt, könnte dieser Schnitt- 
punkt fälschlicherweise als der dem Aufpunkt am nächsten liegende angenommen werden. 
Der Schnittpunkt Sı mit Objekt C liegt aber näher zum Aufpunkt. Um den Fehler zu 
vermeiden, muß auch Voxel 5 noch untersucht werden. Dabei wird dann der richtige 
Schnittpunkt $1 gefunden. | 
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Bit die Nummer des Strahls abgespeichert, mit dem der letzte Schnittpunkt 
berechnet wurde. Wenn beim Start einer Schnittpunktberechnung die Num- 
mer des momentanen Strahls angetroffen wird, ist der Schnittpunkttest bereits 
durchgeführt und braucht nicht wiederholt zu werden. Ein Zurücksetzen ist bei 
dieser Lösung nicht erforderlich, weil die Strahlnummern einfach überschrieben 
werden. 


Bei der Suche nach dem am nächsten zum Aufpunkt eines Strahls gelegenen 
Schnittpunktes, muß man aufpassen, daß man nicht den falschen Schnittpunkt 
findet. Dies kann wieder deshalb passieren, weil ein Objekt mehreren Voxeln 
zugeordnet sein kann: für ein solches Objekt muß der Schnittpunkt nicht in dem 
Voxel liegen, das der Strahl zuerst durchläuft. In einem danach durchlaufenen 
Voxel kann sich aber ein Schnittpunkt mit einem anderen Objekt befinden, 
der näher zum Aufpunkt liegt. Eine entsprechende Situation ist in Abbildung 
8.28 wiedergegeben. Um diesen Fehler zu vermeiden, darf das Durchsuchen der 
Voxel nicht eher aufhören, bis das Voxel, in dem der gefundene Schnittpunkt 
liegt, erreicht ist. Erst dann ist man sicher, daß der gefundene Schnittpunkt 
der am nächsten zum Aufpunkt des Strahls liegende ist. 


8.6.4 Ein Vergleich durch Graphdarstellung 


Die grundlegenden Unterschiede der drei beschriebenen Techniken (hierarchi- 
sche umgebende Volumen, uniforme Raumunterteilung, nichtuniforme Raum- 
unterteilung) lassen sich durch eine Darstellung als gerichteter Graph gut ver- 
anschaulichen, vgl. [Gla89]. Die Graphen repräsentieren die hierarchische Be- 
ziehung der Raumbereiche der gewählten Raumunterteilung und die Zuordnung 
von Objekten zu Raumbereichen. Die Graphen enthalten dabei zwei verschie- 
dene Sorten von Knoten: Knoten, die Raumbereiche repräsentieren, und Kno- 
ten, die Objekte repräsentieren. Sei R(v) der von einem Raumbereichsknoten v 
dargestellte Raumbereich, sei O(w) das von einem Objektknoten w dargestellte 
Objekt. Von einem Raumbereichsknoten v geht eine Kante zu einem Raum- 
bereichsknoten w, wenn R(v) ganz in R(w) enthalten ist und wenn es keinen 
Raumbereichsknoten u mit Raumbereich R(u) gibt, der R(v) ganz enthält und 
der selbst in R(w) enthalten ist. Für die Methode der hierarchischen umge- 
benden Volumen stellen die Raumbereichsknoten mit den dazwischenliegenden 
Kanten also gerade den Hierarchiebaum dar. Für die Methode der nichtuni- 
formen Raumunterteilung wird der Octree dargestellt. Für die Methode der 
uniformen Raumunterteilung gibt es keine hierarchische Beziehung zwischen 
den Raumbereichen, daher gibt es auch keine Kanten zwischen Raumbereichs- 
knoten. Kanten zwischen Objektknoten gibt es nicht. Von einem Objektknoten 
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Abbildung 8.29: Veranschaulichung der beschriebenen Raumunterteilungs-Methoden 
durch Graphen: Raumbereichsknoten sind durch Kreise, Objektknoten durch Kästen wie- 
dergegeben. Kanten zwischen Raumbereichsknoten sind dünn, Kanten zwischen Raum- 
bereichsknoten und Objektknoten sind fett eingezeichnet. Ein Beispiel-Graph für die 
Methode der hierarchischen umgebenden Volumen ist links wiedergegeben, einer für die 
Methode der nicht-uniformen Raumaufteilung in der Mitte, einer für die Methode der 
uniformen Raumaufteilung rechts. 


w geht eine Kante zu einem Raumbereichsknoten v, wenn v bzgl. der Kanten 
zwischen Raumbereichsknoten ein Blatt ist und O(w) ganz oder teilweisein R(v) 
enthalten ist. Für die Methode der hierarchischen umgebenden Volumen ist je- 
des Objekt genau einem Blatt-Raumbereich zugeordnet. Der Gesamtgraph, der 
die Raumbereichs- und die Objektknoten sowie alle Kanten umfaßt, ist also ein 
Baum. Bei der Methode der nicht-uniformen Raumunterteilung kann jedes Vo- 
xel mehrere Objekte enthalten, ein Objekt kann in mehreren Voxeln enthalten 
sein. Der resultierende Gesamtgraph ist also kein Baum mehr, sondern ein 
gerichteter azyklischer Graph. Bei der Methode der uniformen Raumuntertei- 
lung kann ebenfalls jedes Voxel mehrere Objekte enthalten, ein Objekt kann in 
mehreren Voxeln enthalten sein. Da es aber keine Kanten zwischen Raumbe- 
reichsknoten gibt, ist der Gesamtgraph ein bipartiter Graph. Abbildung 8.29 
veranschaulicht die drei Fälle. 


352 KAPITEL 8. RAY-TRACING-VERFAHREN 


8.7 Unterteilung der Strahlrichtungen 


Die Methoden der Raumunterteilung unterteilen den von der darzustellenden 
Szene eingenommenen Raum in Voxel (gleicher oder unterschiedlicher Größe). 
Für einen Strahl werden die Voxel, die der Strahl durchläuft in der Reihen- 
folge, in der sie durchlaufen werden, so lange durchsucht, bis ein Schnittpunkt 
mit einem Objekt gefunden ist. Dadurch werden die meisten Voxel von der 
Betrachtung ausgeschlossen, die verbleibenden werden in einer efiizienten Rei- 
henfolge durchsucht. Das Durchsuchen wird aber für jeden Strahl getrennt 
durchgeführt, es wird kein Gebrauch von der Tatsache gemacht, daß benach- 
barte Strahlen oft die gleichen Voxel durchlaufen. Dies versuchen die in diesem 
Abschnitt beschriebenen Richtungsmethoden dadurch zu berücksichtigen, daß 
sie die entsprechenden Richtungsinformationen in die Voxel-Datenstruktur mit 


aufnehmen, vgl. [Gla89] und [AK87). 


Die Richtungsmethoden arbeiten alle mit einem sogenannten Richtungswürfel, 
der eine ähnliche Rolle wie der bei der Radiosity-Methode verwendete 
Halbwürfel spielt, vgl. Kapitel 9. Der Richtungswürfel ist ein Würfel der 
Kantenlänge 2, dessen Mittelpunkt so im Ursprung des Weltkoordinatensy- 
stems plaziert ist, daß die Kanten parallel zu den Koordinatenachsen liegen, 
vgl. Abbildung 8.30. Der Richtungswürfel dient dazu, die Strahlungsrichtun- 
gen zu diskretisieren. Dazu werden die Seitenflächen des Würfel in rechteckige 
(gleich- oder unterschiedlich große) Bereiche unterteilt. Für die Unterteilung 
der Seitenflächen können ähnliche Techniken angewendet werden wie bei den 
Methoden der Raumunterteilung, übertragen ins Zweidimensionale. Durch Ver- 
schieben des Aufpunktes eines Strahls in den Ursprung kann jedem Strahl ein 
eindeutiger rechteckiger Bereich auf einer der Seitenflächen zugeordnet wer- 
den, nämlich der, in dem der Schnittpunkt des Strahls mit dem Würfel liegt. 
Die geschnittene Seitenfläche bestimmt die dominante Achse des Strahls: die 
sechs Seitenflächen entsprechen sechs dominanten Achsen, die wir mit +X,— X , 
+Y,-Y,+Z,-Z bezeichnen. Die Bestimmung des zu einem Strahl gehören- 
den Rechtecks ist von der für die Aufteilung der Seitenfläche verwendeten 
Methode abhängig. Bei uniformer Aufteilung kann das zugehörige Rechteck 
direkt berechnet werden, bei nicht-uniformer Aufteilung muß man eine Daten- 
struktur durchlaufen (z.B. einen Quadtree), die die Aufteilung der Seitenfläche 
beschreibt. 


Jedes Rechteck auf einer der Seitenflächen definiert eine sogenannte Richtungs- 
pyramide, das ist eine unendliche Pyramide, deren Spitze im Ursprung liegt und 
deren Seitenflächen den Würfel in den Kanten des Rechtecks schneiden. Eine 
Richtungspyramide definiert das Volumen, das von Strahlen durchlaufen werden 
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Abbildung 8.30: Der Richtungswürfel dient dazu, dreidimensionale Strahlrichtungen in 
zweidimensionale Koordinaten umzusetzen. Dazu wird auf jeder Seitenfläche ein (wv)- 
Koordinatensystem definiert, dessen Ursprung in der Mitte der Seitenfläche liegt. Die 
Seitenflächen werden in rechteckige Bereiche unterteilt. Dies kann entweder eine uniforme 
oder eine adaptive Unterteilung sein. Die unteren Abbildungen zeigen je ein Beispiel. 


Siehe auch [G189]. 
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kann, deren Aufpunkt im Ursprung liegt und die dem gleichen Rechteck zugeord- 
net sind. Die Richtungspyramiden können für Strahlen mit gleichem Aufpunkt 
ähnlich eingesetzt werden wie die Voxel in den Methoden der Raumunterteilung: 
einer Richtungspyramide werden alle Objekte zugeordnet, die mit ihr überlap- 
pen. Bei der Suche nach dem Schnittpunkt eines Strahls mit einem Objekt 
brauchen nur die Objekte untersucht zu werden, die in der dem Strahl zugeord- 
neten Richtungspyramide liegen. Dies läßt sich z.B. auf die Schattenberechnung 
bzgl. Punktlichtquellen anwenden, indem man einfach die Strahlrichtung um- 
dreht: Man umgibt jede Punktlichtquellemit einem Richtungswürfel mit diskre- 
tisierten Seitenflächen. Jedem Schattenfühler zu dieser Punktlichtquelle kann 
damit eine eindeutige Richtungspyramide zugeordnet werden. Nur die in dieser 
enthaltenen Objekte können den Punkt, von dem der Schattenfühler ausgesandt 
wurde, verdecken. Diese Objekte brauchen nicht in der Reihenfolge durchsucht 
zu werden, in der sie von dem Schattenfühler durchlaufen werden, weil es zur 
Bestimmung von Schatten ausreicht, wenn irgendein undurchsichtiges Objekt, 
das nicht notwendigerweise das erste zu sein braucht, von dem Schattenfühler 
getroffen wird. Diese Technik ist als Lichtpuffer-Technik bekannt, vgl. [HG86). 


Eine allgemeine Richtungsmethode, die sogenannte Technik der Strahl- 
Klassifizierung, die auf alle Strahlen anwendbar ist, ist in [AK87] beschrieben. 
Die Technik basiert auf der Beobachtung, daß ein Strahl, der üblicherweise 
durch einen dreidimensionalen Aufpunkt und einen dreidimensionalen Rich- 
tungsvektor beschrieben wird, eigentlich nur fünf Freiheitsgrade hat: er läßt sich 
durch einen dreidimensionalen Aufpunkt und zwei sphärische Winkel beschrei- 
ben. Anstelle der sphärischen Winkel verwendet der Algorithmus aber einen 
Richtungswürfel, genauer gesagt, ein rechtwinkliges (uv)-Koordinatensystem, 
das auf jeder Seitenfläche des Richtungswürfels definiert wird, vgl. Abbildung 
8.30. Ein Strahl kann damit mit einem Punkt (zo, Yo, 20,Uo,vo) im fünfdi- 
mensionalen Raum identifiziert werden, wobei ro = (2o,Yo,20) der Aufpunkt 
des Strahls, (uo,vo) sein Schnittpunkt mit der entsprechenden Seitenfläche des 
Richtungswürfels bzgl. des (uv)-Koordinatensystems ist, wenn man den Auf- 
punkt in den Mittelpunkt des Richtungswürfels legt. Da der Richtungswürfel 
Kantenlänge zwei hat, gilt -1 <u<lund -1l1<v<[l. Der Algorithmus un- 
terteilt den fünfdimensionalen Raum in kleine fünfdimensionale Hyperwürfel, 
wobei jeder Hyperwürfel eine Menge von Strahlen mit ähnlichem Ursprung und 
ähnlichen Richtungen repräsentiert. Jedem Hyperwürfel wird eine Liste der Ob- 
jekte zugeordnet, die von den von diesem Hyperwürfel repräsentierten Strahlen 
geschnitten werden können. Um den Schnittpunkt eines Strahls mit den Ob- 
jekten einer Szene zu bestimmen, wird sein zugehöriger Hyperwürfel bestimmt 
und mit den diesem zugeordneten Objekten wird der Schnittpunkt berechnet. 
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Abbildung 8.31: Veranschaulichung der Polyeder-Volumen nach [AK87] für den zwei- 
und dreidimensionalen Fall. Das Polyeder-Volumen umfaßt alle Punkte, die auf Strahlen 
der zugehörigen Richtungspyramide liegen, deren Aufpunkt innerhalb des Voxel-Volumens 
liegt. 


Die Hyperwürfel werden in einem Hyper-Octree abgelegt, dem fünfdimensio- 
nalen Analogon eines Octree. Sei B eine dreidimensionale Box, die alle Ob- 
jekte der darzustellenden Szene enthält. Als Wurzel des Hyper-Octree, die 
alle für die Szene relevanten Strahlen enthält, kann die Vereinigung von sechs 
Kopien des Teilraumes B x [-1 : 1] x [-1,1] verwendet werden, für jede Sei- 
tenfläche des Richtungswürfels eine Kopie. (Also wird man am besten die erste 
Stufe des Hyper-Octree entarten und sie für die Entscheidung benutzen, wel- 
che Seitenfläche des Richtungswürfels von dem vorliegenden Strahl geschnitten 
wird.) Nachdem man so das Wurzelvolumen festgelegt hat, kann der Aufbau des 
Hyper-Octrees rekursiv definiert werden. Dazu können ähnliche Techniken an- 
gewendet werden wie bei den Methoden der Raumunterteilung (übertragen auf 
den fünfdimensionalen Raum). In [AK87] wird eine Variante des BSP-Baumes 
zur Ablage verwendet, die zyklisch über die fünf Dimensionen läuft und für 
jede Dimension die Intervalle exakt halbiert. Nachdem der Hyper-Octree auf- 
gebaut ist, erhält man den zu einem Strahl gehörenden Hyperwürfel durch eine 
Top-down-Suche über den Hyper-Öctree. 


Wir müssen noch bestimmen, welche Objekte einem Hyperwürfel zugeordnet 
werden. Ein fünfdimensionaler Hyperwürfel faßt Strahlen zusammen, deren 
Ursprung im zugehörigen dreidimensionalen Voxel liegen* und deren Richtun- 
gen sich aus dem zugehörigen rechteckigen Bereich auf einer Seitenfläche des 


*Man erhält dieses Voxel durch Projektion auf den dreidimensionalen Raum. 
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Richtungswürfels ergeben. Dies entspricht einem von dem Voxel ausgehen- 
den Polyeder-Volumen (im Original als beam bezeichnet) im dreidimensionalen 
Raum, vgl. Abbildung 8.31. Einem Hyperwürfel müssen alle Objekte zugeord- 
net werden, die in diesem Polyeder-Volumen liegen. Die Zuteilung von Objekten 
zu Hyperwürfeln kann parallel zum Top-down-Aufbau des Hyper-Octrees er- 
folgen, wobei die einem Kind zugeordneten Objekte sich aus den dem Vater 
zugeordneten dadurch ergeben, daß daß man alle Objekte entfernt, die nicht in 
das schmalere Polyeder-Volumen des Kindes fallen. Nach der Zuteilung werden 
die einem Hyperwürfel zugeordneten Objekte nach ihrer minimalen Ausdeh- 
nung bzgl. der zugehörigen dominanten Achse sortiert, um sicherzustellen, daß 
der erste gefundene Schnittpunkt eines Strahls mit einem Objekt auch der am 
nächsten zum Aufpunkt liegende ist. Man beachte, daß alle Strahlen eines 
Hyper-ÖOctrees die gleiche dominante Achse haben. 


Der Aufbau des Hyper-Octrees kann wieder als Vorsortierungsschritt angese- 
hen werden. Um den Schnittpunkt eines Strahls mit einem Objekt der Szene 
zu finden, bestimmt man den den Strahl beschreibenden dimensionalen Punkt 
und durch einen Top-Down-Lauf über den Hyper-Octree den zugehörigen Hy- 
perwürfel. Die diesem Hyperwürfel zugeordneten Objekte werden so lange in 
der vorsortierten Reihenfolge auf Schnittpunkt getestet, bis der erste Schnitt- 
punkt gefunden ist. Dieses ist der am nächsten zum Aufpunkt des Strahls 
gelegene Schnittpunkt. Den Test auf Schnittpunkt kann man wieder mit der 
Technik der umgebenden Volumen beschleunigen. 


In [AK87] sind noch einige Verfahren beschrieben, mit denen der enorme Spei- 
cherplatzbedarf für den Hyper-Octree reduziert werden kann. Dazu gehören 
die lazy evaluation des Hyper-Octree und die Einführung einer Schnittebene 
für jede dominante Achse, die senkrecht auf dieser steht. Alle hinter einer 
Schnittebene liegenden Objekte werden nicht mehr in die Datenstruktur ein- 
getragen. Trotz Anwendung dieser Techniken, auf die wir hier nicht weiter 
eingehen können, bleibt der Platzbedarf des Verfahrens sehr hoch. Dafür erhält 
man nach [AK87] aber auch eine große Laufzeiteinsparung. Für die in [AK87] 
verwendeten Szenen ergab sich etwa eine Gesamtlaufzeit-Ersparnis um Fak- 
tor 10 gegenüber der Methode der nicht-uniformen Raumunterteilung. Damit 
ist das Verfahren wahrscheinlich eines der schnellsten bekannten Ray-Tracing- 


Verfahren. 
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8.8 Ray-Tracing-Verfahren und Objektmo- 
dellierung 


Die Methode der Objektmodellierung (englisch constructive solid geometry, 
oft auch als csg abgekürzt) bietet die Möglichkeit, komplizierte Objekte aus 
sehr einfachen, sogenannten primitiven Objekten zusammenzusetzen, und zwar 
durch Anwendung von Mengenoperationen wie Vereinigung (U), Schnitt (N) und 
Mengendifferenz (\). Als primitive Objekte werden z.B. Kugeln, Quader und 
Zylinder verwendet. Man kann den Vorgang des Zusammensetzens von primi- 
tiven Objekten zu einem komplexeren Objekt wieder durch einen Baum, den 
sogenannten CS$G-Baum beschreiben: die Wurzel dieses Baumes repräsentiert 
das definierte Objekt, die Blattknoten repräsentieren die verwendeten primi- 
tiven Objekte. Die inneren Knoten spezifizieren Mengenoperationen, die auf 
die Kinder angewendet werden. Ein einfaches Beispiel ist in Abbildung 8.32 
wiedergegeben. Die primitiven Objekte sind üblicherweise in einem lokalen Ko- 
ordinatensystem definiert. Beim Zusammensetzen zu einem komplexeren Ob- 
jekt müssen die primitiven Objekte plaziert und skaliert werden. Dies geschieht 
durch Anwendung von linearen Transformationen (Translation, Rotation, Ska- 
lierung), vgl. Abschnitt 3.1. Die entsprechenden Plazierungs- und Skalierungs- 
operationen werden zusammen mit einer Beschreibung des zu plazierenden Ob- 
jektes in den Blattknoten des CSG-Baums abgelegt. Unterschiedliche Objekte 
können durch die gleiche Baumstruktur dargestellt werden. Unterschiedlich 
sind dann nur die Plazierungs- und Skalierungsoperationen in den Blättern. 


Mit der Methode der Objektmodellierung können komplexe Objekte recht ein- 
fach definiert werden. Dies macht ihren Einsatz auch für die Definition der 
Objekte beim Ray-Tracing-Verfahren interessant. Dazu muß allerdings die Be- 
rechnung der Schnittpunkte zwischen Strahl und Objekt der Tatsache angepaßt 
werden, daß die Objekte durch CSG-Bäume beschrieben sind’, vgl. [Rot82], 
[BG89], und [Gla89]. Für die Schnittpunktberechnung zwischen einem Strahl 
und einem durch einen CSG-Baum beschriebenen Objekt wird der CSG-Baum 
von den Blättern her bottom-up durchlaufen. Für jeden Knoten wird eine Liste 
von Strahlsegmenten berechnet, die den Teil des Strahls darstellen, der innerhalb 
des von dem Knoten beschriebenen (Teil-)Objektes liegt. Ein Strahlsegment 
kann z.B. durch die Parameterwerte der beiden Endpunkte bzgl. der Strahlglei- 
chung beschrieben werden. Zu jedem Strahlsegment wird ein Verweis auf das 
zugehörige primitive Objekt gehalten. Wenn als primitive Objekte konvexe Ob- 
jekte verwendet werden, wird für jedes Blatt genau ein Segment errechnet, das 


5Die Optimierungsverfahren können weiter unverändert verwendet werden, z.B. kann wei- 
terhin die Technik der umgebenden Volumen angewendet werden. 
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Abbildung 8.32: Einfaches Beispiel der Anwendung der Methode der Objektmodellie- 
rung: Durch Anwendung einer Vereinigungs- und einer Differenzoperation läßt sich ein 
recht komplexes Objekt definieren: ein auf einen Zylinder gesetzte Kugel, die mit einer In- 
nenbohrung versehen sind (Berliner Fernsehturm mit Fahrstuhlschacht?). Man beachte, 
daß die Beschreibung des so entstehenden Objektes mit polygonalen Oberflächen sehr 
aufwendig wäre. In der Abbildung ist eine zweidimensionale Veranschaulichung wieder- 
gegeben. 
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Abbildung 8.33: Veranschaulichung 


— en >> Styahl der Berechnung der Strahlsegmente 
für innere Knoten in Abhängigkeit von 
en ee 7> Strahl der angewendeten Mengenoperation. 


Die Strahlsegmente sind durchgezo- 
gen eingezeichnet. 


definiert ist durch die beiden Schnittpunkte des Strahls mit dem Objekt. Die 
Strahlsegmente eines inneren Knotens werden aus den Strahlsegmenten der Kin- 
der in Abhängigkeit von der spezifizierten Mengenoperation berechnet, vgl. auch 


Abbildung 8.33: 


e Bei Vereinigung werden die Strahlsegmente der Kinder vereinigt. 

e Bei Schnitt werden die Strahlsegmente der Kinder geschnitten. 

e Bei Mengendifferenz bleiben von den Strahlsegmenten des einen Kindes 
nur die Teile übrig, die nicht mit den Strahlsegmenten des anderen Kindes 
überlappen. 


Als Ergebnis liegt an dem das Gesamtobjekt beschreibenden Wurzelknoten des 
CSG-Baums eine Menge von Strahlsegmenten vor, die alle Schnittpunkte des 
Strahls mit dem beschriebenen Objekt angeben. Der gesuchte, am nächsten 
zum Aufpunkt liegende Schnittpunkt ergibt sich aus einer Sortierung der die 
Strahlsegmente beschreibenden Paramaterwerte. Die lokalen Intensitätswerte 
für diesen Schnittpunkt werden unter Berücksichtigung der Eigenschaften des 
zugehörigen primitiven Objektes errechnet. Der Grund dafür, daß hier alle 
Schnittpunkte des Strahls mit dem Objekt berechnet werden, liegt darin, daß 
man bei der bottom-up-Berechnung der Strahlsegmente nicht a priori sagen 
kann, welches Segment im Endeffekt dasjenige sein wird, das am nächsten zum 
Aufpunkt des Strahls liegt. Es kann z.B. passieren, daß ein Segment, das auf 
einer Stufe des CSG-Baum das am nächsten zum Aufpunkt liegende ist, durch 
Anwendung einer Schnitt- oder Differenzoperation verschwindet und ein an- 
deres auf der nächsten Stufe zu dem am nächsten zum Aufpunkt liegenden 
Segment wird, vgl. auch Abbildung 8.34. 


Zur Beschleunigung der Berechnung der Strahlsegmente können einige Eigen- 
schaften der Mengenoperationen ausgenutzt werden: Wenn ein Kind eines 


360 KAPITEL 8. RAY-TRACING-VERFAHREN 


Abbildung 8.34: Die Anwendung 
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Schnittknotens eine leere Liste von Segmenten zurückliefert, braucht für das an- 
dere Kind keine Segmentberechnung mehr durchgeführt zu werden, der Schnitt 
ist immer leer. Wenn das linke Kind einer Mengendifferenzoperation eine leere 
Segmentliste zurückliefert, braucht das rechte Kind nicht mehr berechnet zu 
werden. Weitere Optimierungsverfahren für die Verwendung von Objektmodel- 


lierung beim Ray-Tracing-Verfahren findet man z.B. in [BvWJ84] und [Ger86]. 


8.9 Zusammenfassung und Ausblick 


Wir haben in diesem Abschnitt das Ray-Tracing-Verfahren beschrieben, mit 
dessen Hilfe sehr realistische Bilder von spiegelnden oder transparenten Objek- 
ten erzeugt werden können. Um den großen Rechenzeitaufwand des Verfah- 
rens zu reduzieren, wurden Beschleunigungsverfahren entwickelt, von denen wir 
die vielversprechendsten beschrieben haben. Leider fehlen Untersuchungen, die 
einen genauen Vergleich dieser Verfahren durchführen und genau aussagen, für 
welche Szenen welches Verfahren am besten geeignet ist. Die im Text genann- 
ten Vergleichszahlen beziehen sich nur auf einige wenige Szenen, für die von 
den Autoren der Originalartikel Tests durchgeführt wurden. Wegen des Man- 
gels an genauen Untersuchungen muß man sich deshalb im Moment auf recht 
vage Aussagen und viel Intuition stützen, um das für die vorliegende Szene am 
besten geeignete Beschleunigungsverfahren zu finden. Generell ist wahrschein- 
lich das Strahl-Klassifizierungs-Verfahren das im Moment schnellste bekannte 
Verfahren, das aber den Nachteil eines sehr großen Speicherplatzbedarfs hat. 
Darüber, wie groß dieser genau ist, gibt es leider keine Angaben. 


Außer der Entwicklung neuer Beschleunigungsverfahren liegt ein zukünftiger 
Forschungsschwerpunkt im Bereich des Ray-Tracing-Verfahrens sicher auch in 
der Entwicklung schneller paralleler Versionen, die auf einem der heute doch 
schon recht oft eingesetzten Parallelrechner effizient laufen. Eine sehr einfa- 
che Methode der Parallelisierung besteht darin, jedem Prozessor eine komplette 
Beschreibung der darzustellenden Szene zur Verfügung zu stellen und jeden Pro- 
zessor unabhängig eine Anzahl von Primärstrahlen verfolgen zu lassen. Dies ist 
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für Parallelrechner mit gemeinsamen Speicher kein Problem, für die am mei- 
sten eingesetzten Rechner mit verteiltem Speicher ist dieses Verfahren aber nur 
so lange gut einsetzbar, wie die einzelnen Prozessoren genügend Speicherplatz 
haben, um die Szene abzuspeichern. Was man tut, wenn dies nicht der Fall ist, 
ist dagegen noch ziemlich unerforscht. Man könnte ın diesem Fall den einzel- 
nen Prozessoren Raumbereiche zuteilen, für die sie sich um die Verfolgung der 
Strahlen kümmern. Dagegen spricht aber die große Kommunikationszeit zwi- 
schen den Prozessoren für diese Rechner. Für dünnbesetzte Szenen, in denen 
die Strahlen oft über große Raumbereiche verfolgt werden müssen, ist dieses 
Verfahren daher wahrscheinlich schlecht einsetzbar. 


Recht wenig erforscht ist bisher auch der Einsatz des Ray-Tracing-Verfahrens 
zur Erzeugung von Filmspots im Animationsbereich. Dabei müssen viele Bil- 
der einer sich zeitlich verändernden Szene erzeugt werden. Wenn jedes dieser 
Bilder separat mit dem Ray-Tracing-Verfahren berechnet wird, ist dafür ein 
sehr hoher Einsatz von Rechenzeit erforderlich. Eine sich bietende Optimie- 
rungsmöglichkeit beruht auf der Beobachtung, daß zeitlich benachbarte Bilder 
einer Animationssequenz oft sehr ähnlich sind, weil die Objekte der Szene sich 
stetig durch den Raum bewegen. Also wird ein Pixelstrahl für dicht aufein- 
anderfolgende Zeitpunkte mit großer Wahrscheinlichkeit das gleiche oder ein 
benachbartes Objekt treffen. Man könnte dies dadurch ausnutzen, daß man die 
Objekte in einer geeigneten Datenstruktur ablegt, die die zeitliche Kohärenz 
benachbarter Bilder berücksichtigt. Wie eine solche Datenstruktur aussehen 
könnte, ist bisher aber kaum erforscht. 


Kapitel 9 


Radiosity-Verfahren 


Wie im letzten Kapitel beschrieben, ist das Ray-Tracing-Verfahren sehr gut 
zur Darstellung von spiegelnder Reflexion und Transmission geeignet. Es hat 
aber den Nachteil, daß es das von anderen Objekten diffus abgestrahlte Licht, 
das auf den betrachteten Punkt einer Oberfläche fällt und das in Richtung 
des Betrachters reflektiert wird, nur über einen groben Umgebungsterm I. - ku 
berücksichtigt. Dabei ist J. eine Umgebungsintensität, die als konstant für die 
gesamte Szene angenommen wird, k, ist der Umgebungs-Reflexionskoeflizient. 
Der Grund für diese grobe Berücksichtigung liegt in dem erforderlichen Re- 
chenaufwand, der für eine genaue Berücksichtigung erforderlich wäre: Das in 
Richtung des Betrachters diffus reflektierte Licht kann aus allen Richtungen 
auf die Oberfläche treffen. Für eine exakte Berücksichtigung müßten sehr viele 
Strahlen in alle möglichen Richtungen ausgesandt werden, was den ohnehin 
enormen Rechenaufwand erheblich steigern würde. 


Das in diesem Kapitel beschriebene Radiosity- Verfahren ist im Gegensatz zum 
Ray-Tracing-Verfahren in der Lage, das von anderen Objekten kommende 
und in Richtung des Betrachters diffus reflektierte Licht genau zu berück- 
sichtigen. Dies wird durch eine Diskretisierung der darzustellenden Szene in 
kleine Flächenelemente und eine nachfolgende Berechnung eines diffus abge- 
strahlten Intensitätswertes für jedes dieser Flächenelemente erreicht. Für die 
Berechnung dieser Intensitätswerte werden alle anderen Flächenelemente der 
Szene berücksichtigt, das Verfahren ist also wie das Ray-Tracing-Verfahren ein 
globales Beleuchtungsverfahren. Der Rechenaufwand für die Berechnung der 
Intensitätswerte ist sehr hoch, höher als der Rechenaufwand für das gesamte 
Ray-Tracing-Verfahren. Daher müssen wieder Beschleunigungsverfahren ange- 
wendet werden, damit das Verfahren überhaupt praktikabel ist. Die errech- 
neten Intensitätswerte sind unabhängig von der Lage der Projektionsebene. 
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Dies ermöglicht eine relativ schnelle Darstellung verschiedener Ansichten ei- 
ner Szene, wenn die Intensitätswerte erst einmal berechnet sind. Beim Ray- 
Tracing-Verfahren muß für die Darstellung einer anderen Ansicht der gleichen 
Szene das gesamte Verfahren neu durchlaufen werden. 


Mit dem Radiosity-Verfahren dargestellte Szenen wirken sehr realistisch, so- 
lange sie nur diffus reflektierende Objekte enthalten. Damit ist das Radiosity- 
Verfahren gut geeignet zur Darstellung von Innenraumszenen. Dagegen ist das 
Radiosity-Verfahren schlecht anwendbar für die Darstellung von spiegelnder 
Reflexion und Transmission. Wir werden in diesem Kapitel das Radiosity- 
Verfahren und mögliche Beschleunigungsverfahren beschreiben. Wir werden 
auch auf ein Mischverfahren eingehen, das eine Kombination aus Radiosity- 
Verfahren und Ray-Tracing-Verfahren ist. Ein solches Mischverfahren bietet 
sich an, weil es die Vorteile der beiden Verfahren vereinigen kann. Damit 
ist eine sehr realistische Darstellung von diffus und spiegelnd reflektierenden 
Objekten möglich. 


9.1 Grundlegende Theorie und Basis-Algo- 
rithmus 


Das Radiosity-Verfahren, vgl. [CG85], [ICG86], [Wat89], [FvDFH90], basiert 
auf dem Energieerhaltungssatz, der besagt, daß in einem abgeschlossenen Sy- 
stem keine Energie verloren gehen kann. Mit Energie ist dabei die Energie 
des Lichtes gemeint, das von den Lichtquellen in Form von Photonen abge- 
strahlt wird. Anders als bei den bisher vorgestellten Verfahren werden die 
Lichtquellen als Objekte der Szene behandelt, die eine Ausdehnung haben, 
und die sich von den anderen Objekten nur dadurch unterscheiden, daß sie 
Licht aussenden. Die dem Verfahren zugrunde liegenden physikalischen Gesetze 
wurden entwickelt, um den Wärmeaustausch zwischen Objekten zu simulieren, 
vgl. [SH81]. Grundsätzlich besteht das Verfahren aus zwei Schritten, die nach- 
einander ausgeführt werden: Im ersten Schritt werden die in der Szene enthal- 
tenen Oberflächen in kleine Flächenelemente unterteilt, die als ebene Polygone 
behandelt werden. Für jedes dieser Flächenelemente wird unter Berücksichti- 
gung aller anderen Flächenelemente ein konstanter Strahlungswert berechnet. 
Die berechneten Strahlungswerte sind unabhängig von der Position des Be- 
trachters. Nachdem die Strahlungswerte berechnet sind, wird in einem zwei- 
ten Schritt für die Position des Betrachters eine Ansicht der Szene berechnet. 
Bei Wechsel der Position des Betrachters braucht nur der zweite Schritt wie- 
derholt zu werden, die im ersten Schritt errechneten Strahlungswerte ändern 
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sich nicht. Bei der Berechnung der Intensitäten der Flächenelemente wird an- 
genommen, daß die Oberflächen dem Lambert’schen Cosinusgesetz gehorchen, 
vgl. Abschnitt 5.3.1, d.h. daß perfekte diffuse Reflexion vorliegt. Wir werden 


jetzt zuerst die zugrundeliegenden physikalischen Gesetze beschreiben. 


Die Strahlungsdiche oder kurz Strahlung B eines Flächenelementes ist definiert 
als die Energie, die von diesem pro Zeiteinheit und pro Flächeneinheit abge- 
strahlt wird, vgl. Abschnitt 5.2. Die Einheit, in der die Strahlung gemessen 
wird, ist daher W/m?. Aus dem Energieerhaltungssatz folgt, daß die von einem 
Flächenelement : abgestrahlte Energie sich aus emittierter und aus reflektierter 
Energie zusammensetzt. Nur für Lichtquellen hat die emittierte Energie einen 
Wert ungleich Null. Die reflektierte Energie kann von allen anderen Flächen- 
elementen der Szene stammen und ist umso größer, je reflektierender : ist. Es 
gilt also, vgl. [CG85], [CCWGS88] und [FvDFH$90]: 
A: 
B; = B+ RB Fu" (9.1) 


v 


Dabei sind B; und B; die von den Elementen : und 7 abgegebene Strahlungen, 
gemessen in Energie pro Zeit und Flächeninhalt. E&; ist die Strahlung, die Ele- 
ment : von sich aus emittiert. R; ıst der dimensionslose Reflexionskoefhizient 
von Flächenelement :. F;; ist der dimensionslose Formfaktor, der angibt, wel- 
cher Anteil der Energie, die das gesamte Flächenelement j verläßt, das gesamte 
Flächenelement : auf direktem Weg erreicht. A; und A; sind die Flächeninhalte 
der Flächenelemente 2 und 5. Die auf Flächenelement : einfallende Strahlung 
bestimmt man als Summe der Strahlungen, die alle anderen Flächenelemente als 
ganzes verlassen. Jede dieser Strahlungsmengen wird skaliert mit einem Faktor, 
der angibt, welcher Teil davon auf einem Einheitsflächenelement von : ankommt. 
B; F;; A; ist die Strahlungsleistung, vgl. Abschnitt 5.2, die das gesamte Flächen- 
elemente j verläßt und das gesamte Flächenelement : erreicht. B; F};; A;/A; ist 
die Strahlungsleistung, die das gesamte Flächenelemente 7; verläßt und ein Ein- 
heitsflächenelement von : erreicht. Es gilt die reziproke Relation, vgl. [SH81], 


F;A,; = F;A; (9.2) 


mit deren Hilfe (9.1) umgeformt werden kann zu 
B;=E;+R;) B;F; (9.3) 
; | 


Dies läßt sich auch in Matrixschreibweise darstellen: 
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1-RıFı -Rıfıa —Rı Fin Bı Eı 
—RaFaıı 1-Rofa — Rn Fan B; Er 

-, nu = . 1.9.4) 
— RuFnı — Ru Fn2 . 1- RuFan B, En 


Der Reflexionskoeflizient R; und die emittierte Energie E; sind von der Wel- 
lenlänge des Lichtes abhängig. Deshalb muß man üblicherweise dieses Glei- 
chungssystem für verschiedene Wellenlängen lösen, um ein aussagekräftiges Er- 
gebnis zu erhalten. Die Formfaktoren F;; sind dagegen nur von der Geometrie 
der Szene abhängig und hängen nicht von der Wellenlänge ab. Wir werden uns 
jetzt damit beschäftigen, wie man die Formfaktoren berechnet. 


Aus der Definition der Formfaktoren können bestimmte Eigenschaften direkt 
abgeleitet werden. Da die Formfaktoren nur den direkten Lichttransport von 
Flächenelement : zu Flächenelement 5 beschreiben, gilt 


Fi=0 


Da nach dem Energieerhaltungssatz die von einem Flächenelement : abge- 
strahlte Energie irgendwo in der Szene auftreffen muß, gilt: 


>, Fj=1 füralli=1,..,n 


j=1 


Wenn Dr Fi; > 1 wäre, würde irgendwo Energie erzeugt werden. Wenn 

j=ı Fir < 1 wäre, würde irgendwo Energie verloren gehen. Beides ist in einem 
abgeschlossenen System nicht möglich. Wenn zwischen den Flächenelementen 
ı und 7 ein drittes Flächenelement k liegt, so daß man von : aus j nicht sehen 
kann und umgekehrt, so gilt F;; = 0, weil kein Licht von j direkt nach : gelangen 
kann. Für alle anderen Fälle müssen die Formfaktoren aus der Geometrie der 
Szene bestimmt werden. Dies ist der bei weitem rechenzeitaufwendigste Schritt 
bei der Radiosity-Methode. Wenn die Formfaktoren berechnet sind, ist die 
Lösung des obigen Gleichungssystems (9.4) mit Gauß’scher Elimination oder 


Gauß-Seidel-Verfahren schnell auszuführen. 


Das Ziel ist es, eine Berechnungsgleichung für den Formfaktor F}; = F4,a, zu 
finden, der den Energieaustausch von Flächenelement A; zu Flächenelement 
A; beschreibt. Dazu betrachtet man zuerst differentielle Teile dieser Flächen- 
elemente: Sei dA; ein differentielles Flächenelement auf A; und sei dA; ein 
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Abbildung 9.1: Veranschaulichung 
des Energieaustausches zwischen den 


differentiellen Flächenelementen dA; 
und dA;. 





differentielles Flächenelement auf A; (siehe Abbildung 9.1). r sei der Abstand 
zwischen dA; und dA;, d; sei der Winkel zwischen der Verbindungsgeraden von 
dA; und dA; und dem Normalenvektor von A;. $; sei der Winkel zwischen der 
Verbindungsgeraden von dA; und dA; und dem Normalenvektor von A;. Für 


den differentiellen Formfaktor FqA,aA,, der den Energieaustausch von dA; nach 
dA; beschreibt, gilt!: 


cos d; cos d; dA; 
FaAida; = Baar Pr 


(9.5) 
cos d; tritt in dieser Formel auf, weil dA; nach dem Lambert’schen Gesetz 
Strahlung aufnimmt. cosd; tritt auf, weil dA; nach dem Lambert’schen Ge- 
setz Strahlung abgibt. Die von dA; abgestrahlte Intensität wird gleichmäßig in 
alle Richtungen abgestrahlt. Da dA; von dA, r Längeneinheiten entfernt ist, 
kommt von der insgesamt von dA, abgestrahlten Energie der Teil dA;/(2rr?) 
beim Flächenelement dA; an (2rr? ist die Oberfläche der Halbkugel mit Ra- 
dius r und Mittelpunkt auf dA;). Den auf dem gesamten Flächenelement A; 
ankommenden Bruchteil der von dA, abgegebenen Strahlung erhält man durch 
Integration über das Flächenelement A;: 


cos di cos d; 
F dA;A,; — nm 4; 
!In [CG85] fehlt der Faktor 2 im Nenner. Der Autor glaubt, daß dies auf eine mißverständ- 
liche Darstellung in [SH81] zurückzuführen ist, in der der Faktor 2 in einer Konstante versteckt 
ist. 
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Far,a, ist der Formfaktor vom differentiellen Element dA; zum endlichen Ele- 
ment A;. Der Formfaktor vom endlichen Bereich A; zum endlichen Bereich A; 
beschreibt die durchschnittliche Energie, die von einem differentiellen Element 
dA; von A; abgestrahlt wird und die A; erreicht: 


1 cos d;Ccosd; ,, 
Faa; — A; |, |, Inr2 dA;dA, 


Noch nicht berücksichtigt ist dabei, daß Flächenelemente ganz oder teilweise 
verdeckt sein können. Dies berücksichtigt man durch eine binäre Funktion 


0, wenn zwischen dA; und dA; ein verdeckendes Objekt liegt 
1, sonst 


Hid(dA;,dA;) = { 


Damit wird 


41 cos d; cos d;... | NIAdA, 
Fa, = ran J, Inn? Hid(dA,,dA;)dA;dA; 


Eine analytische Lösung für dieses Doppelintegral ist in den meisten Fällen 
schwer oder unmöglich. Es gibt zwar Tabellen für Formfaktoren zwischen spe- 
ziellen Oberflächen mit einer bestimmten Orientierung (z.B. parallele ebene 
Flächen mit bestimmter Orientierung zueinander), damit werden aber nur die 
wenigsten Anwendungen abgedeckt. Deswegen versucht man, das Doppelinte- 
gral numerisch zu lösen. Eine Vereinfachung der Berechnung ergibt sich aus 
der folgenden Beobachtung: Wenn der Abstand r zwischen den beiden endli- 
chen Flächenelementen A; und A; im Vergleich zu ihrer Ausdehnung groß ist 
und wenn die Flächenelemente nicht ganz oder teilweise voreinander verdeckt 
sind, dann ist das innere Integral beinahe konstant, weil d; für verschiedene 
differentielle Flächenelemente von A; beinahe gleich ist. Der Effekt des äußeren 
Integrals ist dann einfach eine Multiplikation mit A;. Es gilt also: 


cos d; cos d; 
2rr? 


Faa,; = Fara; = dA; 
wobei dA; in der Mitte von A; postiert sei. Wenn A; und A; nahe beieinan- 
derliegen oder teilweise verdeckt sind, unterteilt man A; und A; in kleinere 
Flächenelemente, so daß die Approximation gültig bleibt. 


Zur Lösung des Integrals betrachten wir die vorliegende Situation: Ein endli- 
ches Flächenelement A; strahlt Energie in alle Richtungen gleichmäßig ab. Wir 
wollen wissen, welcher Teil davon auf A; ankommt. Durch die obige Appro- 
ximation wird A; auf seinen Mittelpunkt reduziert. Wenn wir die über dem 
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Abbildung 9.2: Wenn zwei Flächenelemente Aı und Az die gleiche Projektion auf die 
A; umgebende Einheitskugel haben, haben sie bzgl. A; auch gleiche Formfaktoren. 


Mittelpunkt von A, errichtete Einheitskugel betrachten, so gilt folgendes: Die 
von A; aufgenommene Energie ist proportional zu der Fläche der Projektion 
von A; (mit Projektionszentrum im Mittelpunkt von A;) auf diese Einheitsku- 
gel. Wenn A,,; die Fläche dieser Projektion ist, so gilt für den Formfaktor F4;A, 
also: 

A; 


27 
Eine formale Herleitung dieser Beziehung findet man z.B. in [SH81]. Zwei 
Oberflächen, die die gleiche Projektion auf die Einheitskugel haben, erhalten 
den gleichen Teil der von A; abgestrahlten Energie, haben also gleiche Formfak- 
toren, vgl. Abbildung 9.2. Die Berechnung der Formfaktoren nach (9.6) wird 
als Halbkugel-Methode bezeichnet, vgl. [SH81]. 


Die rechenzeitaufwendige Berechnung der Projektion der Flächenelemente auf 
die Einheitskugel läßt sich durch eine Diskretisierung der Oberfläche der Ein- 
heitskugel vermeiden: Man unterteilt die Oberfläche der Einheitskugel in Berei- 
che, die gleiche Raumwinkel abdecken und zählt zur Bestimmung des Formfak- 
tors F}; die von der Projektion von A; auf die Einheitskugel um A, überdeck- 
ten Bereiche (diese lassen sich mit einigen Schnittpunktberechnungen zwischen 
Gerade und Kugel bestimmen). Da aber auch diese Methode wegen der Be- 





FaA; = (9.6) 
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stimmung der diskreten Bereiche auf der Oberfläche der Einheitskugel recht 
unhandlich ist, benutzt man üblicherweise die sogenannte Halbwürfelmethode: 
Anstatt A; mit einer Einheitskugel zu umgeben, umgibt man A; mit einem 
Würfel der Kantenlänge 2, dessen Mittelpunkt in den Mittelpunkt von A; ge- 
legt wird, vgl. Abbildung 9.3. Die Seitenflächen des Würfels werden in qua- 
dratische Bereiche (sogenannte Pixel) unterteilt. Üblicherweise verwendet man 
Pixelnetze von 50 x 50 oder 100 x 100 pro Seitenfläche. Weil man annimmt, 
daß A; nur in einen Halbraum Energie abstrahlt, benutzt man nur den oberen 
Halbwürfel. Der Formfaktor F;; wird durch Projektion von A; auf den diskre- 
tisierten Halbwürfel um A; berechnet. Jedes überdeckte Pixel q liefert einen 
Beitrag, den sogenannten Delta-Formfaktor AF,, zum zu bestimmenden Form- 
faktor F;,. Fi; ergibt sich als Summe der Delta-Formfaktoren der überdeckten 
Pixel. Wenn die Projektion von mehreren Flächenelementen das gleiche Pixel 
p überdecken, so leistet das Pixel nur zu dem Formfaktor des Flächenelementes 
einen Beitrag, das am nächsten zum Halbwürfel liegt. Das ist das Flächenele- 
ment, das man sieht, wenn man vom Mittelpunkt von A; aus durch p schaut. 
Es gilt also: 


R 
F;=)_ AF, (9.7) 


g=1 


Dabei ist R die Anzahl der Pixel, die von der Projektion von A; überdeckt 
werden, wobei es kein A; gibt, dessen Projektion eines dieser Pixel überdeckt 
und das näher als A; zum Halbwürfel liegt. 


Man beachte, daß jedes Pixel auf einer der Seitenflächen des Würfels je nach 
Lage unterschiedlich große Raumwinkel abdeckt, die Pixel haben also je nach 
Lage einen unterschiedlichen Delta-Formfaktor. Wir werden uns jetzt mit der 
Bestimmung der Delta-Formfaktoren beschäftigen. 


Wir verwenden ein rechtshändiges Koordinatensystem, dessen Ursprung im Mit- 
telpunkt des Würfels liegt, d.h. im Mittelpunkt von A;. Die z-Achse stehe senk- 
recht auf der Kopffläche des Halbwürfels. Wir betrachten ein Pixel q auf der 
Kopffläche des Halbwürfels, vgl. Abbildung 9.4. r sei der Abstand des Mittel- 
punktes von q zum Ursprung, (z,,%,, 1) seien die Koordinaten des Mittelpunktes 
von g. Nach Pythagoras gilt: 


”=1+2+y 


Wenn d; und d; die in Abbildung 9.4 eingezeichneten Winkel sind, gilt außer- 
dem: 
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Abbildung 9.3: Veranschaulichung der Halbwürfelmethode: der Formfaktor vom 
Flächenelement A; zu Aı wird durch Projektion von Aı auf den A; umgebenden 
Halbwürfel bestimmt. 





Abbildung 9.4: Herleitung des Delta-Formfaktors für ein Pixel q auf der Kopffläche des 
Halbwürfels. 
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=; 
del I 
"or. YI+22+y2 


Wenn Ag der Flächeninhalt von Pixel g ist, erhält man nach Gleichung 9.5 
für die Formfaktoren zwischen differentiellen Flächenelementen für Pixel q den 
Delta-Formfaktor 


Ag 
AF, = cosd;cos an 
Ag Ag 


Int 2r(l +22 +y2)2 


Für ein Pixel p auf der rechten oder linken Seitenfläche erhält man mit einer 
analogen Herleitung: 


Ap 


Ar = —— 
p 2r(1 + y2+ 22)? 


Für ein Pixel p auf der vorderen oder hinteren Seitenfläche erhält man: 
Ap 


AF= oe 
?  2r(l+22+ 22)2 


Die mit diesen Formeln errechneten Werte für die Delta-Formfaktoren der ver- 
schiedenen Pixel werden in einer Tabelle abgelegt, auf die bei der Berechnung 
der Formfaktoren nach Gleichung (9.7) zugegriffen wird. Mit Formel (9.7) wer- 
den die Formfaktoren von Flächenelement A; zu allen Flächenelementen A,, 
j3 #i, bestimmt. Damit kann eine Zeile der Formfaktor-Matrix in (9.4) berech- 
net werden. Die Anwendung der beschriebenen Halbwürfelmethode auf alle 
A; liefert die komplette Matrix. Damit können durch Lösung des Gleichungs- 
systems (9.4) z.B. mit dem Gauß-Seidel-Verfahren? die gesuchten Strahlungs- 
werte B; zu jedem Flächenelement A, bestimmt werden. Das Gleichungssystem 


2Nach [CG85] ist das iterativ arbeitende Gauß-Seidel-Verfahren besonders gut geeignet, 
weil die Formfaktor-Matrix diagonaldominant ist (d.h. die Summe der Absolutwerte jeder 
Zeile ist kleiner als der Diagonalwert), was eine schnelle Konvergenz garantiert. Als Start- 
wert für die Iteration können die Strahlungswerte verwendet werden, die die zugehörigen 
Flächenelemente von sich aus emittieren. Die Iteration ist beendet, wenn der momentan er- 
rechnete Iterationswert von dem vorher errechneten um nicht mehr als ein kleiner, vorher 
festgelegter, prozentualer Faktor abweicht. Dies ist laut [CG85] üblicherweise nach sechs bis 
acht Iterationsschritten der Fall. Damit ist die Lösung in einem Bruchteil der Zeit gefunden, 
die man mit anderen Lösungsverfahren benötigt. 
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wird üblicherweise für drei verschiedene Farbwerte (rot, grün, blau) gelöst, um 
der Tatsache gerecht zu werden, daß die Reflexionskoeffizienten und die von den 
Flächenelementen selbst emittierte Strahlung wellenlängenabhängig sind. 


Im ersten Schritt des Radiosity-Verfahrens wurden die Objekte der Szene in 
kleine Flächenelemente unterteilt, für die durch Lösung des Gleichungssystems 
(9.4) Strahlungswerte bestimmt worden sind. Im zweiten Schritt soll mit Hilfe 
dieser Strahlungswerte eine Sicht der Szene auf dem Bildschirm dargestellt wer- 
den. Dazu sollte zwischen den Flächenelementen, die eine Oberfläche eines 
Objektes bilden, ein Ausgleich berechnet werden, um sichtbare Übergänge zwi- 
schen den Intensitätswerten dieser Flächenelemente zu vermeiden und den Ob- 
jekten eine gleichmäßige Farbdarstellung zu geben. Da das Verfahren prinzipiell 
in der Lage ist, ohne eine Neuberechnung der Formfaktor-Matrix verschiedene 
Ansichten darzustellen, sollte ein Ausgleichsverfahren verwendet werden, das 
im Objektraum arbeitet”, damit ein bestimmter Punkt eines Objektes für ver- 
schiedene Ansichten der Szene den gleichen Intensitätswert erhält. 


In [CG85] wird zur Berechnung der Intensitätswerte innerhalb eines Flächenele- 
mentes eine bilineare Interpolation vorgeschlagen, ähnlich der beim Gouraud- 
Verfahren verwendeten, vgl. Abschnitt 6.1. Dazu muß man die für die Flächen- 
elemente errechneten Intensitätswerte auf deren Eckpunkte übertragen. Für 
Flächenelemente, die innerhalb eines Polygons liegen, das zur Beschreibung 
eines Objektes dient, bestimmt man die Intensitätswerte an den Eckpunkten 
durch Mittelung der Intensitätswerte der angrenzenden Flächenelemente. Die 
Werte für die Eckpunkte von Flächenelementen, die am Rande eines Polygons 
liegen, werden durch lineare Extrapolation bestimmt. Abbildung 9.5 zeigt ein 
Beispiel: Man nimmt an, daß die für die Flächenelemente errechneten Inten- 
sitätswerte die Werte für die Mittelpunkte der Flächenelemente sind. Damit 
sind die Werte I/(zo), I(zı), I(z2), I(z3) bekannt. /(z,) erhält man durch Mit- 
telung der Intensitätswerte der angrenzenden Flächenelemente, /(z;) ergibt sich 
als Mittelwert von /(zo) und /(zı): 


I(z4) = $(I(xo) + I(zı) + I(z2) + I(z3)) 
I(z;) = 3(I(z0) + I(zı)) 


3Die Unterscheidung zwischen Bildraum und Objektraum wurde in Kapitel 4 für die Al- 
gorithmen zur Eliminierung verborgener Oberflächen eingeführt und ist auf die vorliegende 
Situation übertragbar: Eine Ausgleichsberechnung im Objektraum berechnet für jeden Punkt 
einer Oberfläche einen Intensitätswert, der unabhängig von der Position des Betrachters und 
der Lage der Projektionsebene ist. Eine Ausgleichsberechnung im Bildraum berechnet da 
gegen für jedes Pixel des Bildschirms einen Intensitätswert, so daß zwischen benachbarten 
Pixeln ein abrupter Farbübergang vermieden wird, wenn Punkte des gleichen Objektes wie- 
dergegeben werden. 
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1.25-1.25-1.25 

| | | 
2.25-2.75-3.25 

| | | 
£ı 3.25-4.25-5.25 





Abbildung 9.5: Beispiel zur Berechnung der Intensitätswerte an den Eckpunkten der 
Flächenelemente. 


I(zs) ergibt sich als Extrapolation aus /(z4) und /(z;): 
I(ze) = I(z4) + (I(zs) - I(eı)) 2 = I2a) + 2(Ilzs) - I(2u)) 


TE 4 


I(z7) ergibt sich als Extrapolation aus /(z4) und /(zo): 

I(z7) = I(z4) + (I(zo) - I(z4)) 2 = za) + 2(I(zo) - I(24)) 
Nachdem so die Intensitätswerte für die Eckpunkte der Flächenelemente be- 
stimmt sind, kann man für jeden Punkt innerhalb eines Flächenelementes einen 
Intensitätswert mit bilinearer Interpolation bestimmen: Man berechnet zuerst 
Intensitätswerte für die Seitenkanten des Flächenelementes mit linearer Inter- 
polation. Dann legt man eine horizontale Gerade durch den ım Innern eines 
Flächenelementes liegenden, gesuchten Punkt und berechnet aus den Strah- 
lungswerten der Schnittpunkte der Gerade mit den Seitenkanten des Flächen- 
elementes durch lineare Interpolation den Strahlungswert für den gegebenen 


Punkt. 


Nachdem durch Lösung des Gleichungssystems (9.4) für jedes Flächenelement 
ein Intensitätswert bestimmt ist, kann man eine beliebige Sicht der Szene wie 
folgt auf dem Bildschirm darstellen: Abhängig von der Position des Betrachters 
bestimmt man für jedes Pixel das Flächenelement, das von dem Pixel dargestellt 
wird. Das kann z.B. durch ein vereinfachtes Ray-Tracing-Verfahren geschehen, 
indem man für jedes Pixel einen Strahl verwendet, der durch die Position des 
Betrachters und das Pıxel verläuft. Der erste Schnittpunkt des Strahles mit 
einem Objekt der Szene bestimmt das für den Pixel sichtbare Flächenelement. 
Den für den Schnittpunkt darzustellenden Intensitätswert berechnet man mit 
der gerade beschriebenen bilinearen Interpolation. 


Nach einer Änderung der Position des Betrachters braucht nur der letzte Schritt 
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Flächenelemente Gleichungssystem | Bildschirmdarstellung 
1740 180 min 10 min 16 min 
2370 337 min 18 min 


14 min 
Tabelle 9.1: Laufzeit der verschiedenen Schritte zur Darstellung einer Szene unter Ver- 
wendung des Radiosity-Verfahrens nach [CG85]. Die angegebenen Laufzeiten wurden auf 
einer VAX 11/780 gemessen. 















des Verfahrens, die Darstellung auf dem Bildschirm mit dem vereinfachten Ray- 
Tracing-Verfahren wiederholt zu werden. Wenn sich die Beleuchtung der Szene 
durch Ein- oder Ausschalten einer Lichtquelle ändert, muß das Gleichungssy- 
stem neu gelöst werden und die Darstellung auf dem Bildschirm muß wiederholt 
werden. Eine Neuberechnung der Formfaktoren ist auch in diesem Fall nicht 
notwendig. Dies ist eine enorme Ersparnis an Rechenzeit, weil die Berechnung 
der Formfaktoren der bei weitem aufwendigste Schritt des Verfahrens ist, siehe 
auch Tabelle 9.1. Eine Zusammenfassung der Methode ist als Flußdiagramm in 
Abbildung 9.6 wiedergegeben. 


Wie bereits erwähnt, ist das Radiosity-Verfahren sehr rechenzeitintensiv. In 
[CG85] sind Beispiel-Berechnungen angegeben, die in Tabelle 9.1 wiederge- 
geben sind. Man sieht, daß die bei weitem meiste Zeit für die Berechnung 
der Formfaktoren benötigt wird. Die Lösung des Gleichungssystems und die 
Darstellung auf dem Bildschirm verbrauchen dagegen vergleichsweise geringe 
Rechenzeit. Für die sehr hohe Rechenzeit erhält man aber auch sehr realisti- 
sche Darstellungen von Szenen, für die die diffuse Reflexion überwiegt. 


9.2 Nachträgliche Verfeinerung der Untertei- 
lung 


Die Anzahl der zu berechnenden Formfaktoren, und damit auch die für de- 
ren Berechnung erforderliche Laufzeit, wächst quadratisch mit der Anzahl der 
Flächenelemente der Szene. Eine grobe Aufteilung der Objekte in Flächen- 
elemente resultiert also in einer erheblichen Einsparung an Laufzeit. Auf der 
anderen Seite ist die Qualität des erzeugten Bildes umso besser, je feiner die 
Objekte in Flächenelemente unterteilt werden, weil mit einer feineren Unter- 
teilung auch die Genauigkeit der errechneten Strahlungswerte zunimmt. Dabei 
ist eine feine Unterteilung vor allem in Regionen wichtig, die große Strahlungs- 
unterschiede aufweisen, also z.B. an Schattengrenzen. In Regionen mit kleinen 
Strahlungsunterschieden ist eine feine Unterteilung dagegen nicht so entschei- 
dend. Dies legt eine adaptive Unterteilung in Flächenelemente nahe: ein Objekt 
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Eingabe 






Berechnung der Formfaktoren 


Lösung des Gleichungssystems 






Darstellung auf dem Bildschirm 










Änderung der 
Position des Betrachters 






Änderung der Beleuchtung 


Berechnung der Formfaktoren | Halbwürfelmethode 
Lösung des Gleichungssystems | Gauß-Seidel-Verfahren 


Darstellung auf dem Bildschirm | Ray-Tracing bis zum ersten 
Schnittpunkt 


Abbildung 9.6: Zusammenfassung des Radiosity-Verfahrens. 


e Beschreibung der Polygone, aus 
denen die Objekte der Szene beste- 
hen, mit Emissionswert und Refle- 
xionskoeflizient 

e Parameter zur Steuerung der Auf- 
teilung der Polygone in Flächenele- 
mente 
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Abbildung 9.7: Veranschaulichung der 
nachträglichen Verfeinerung: A; und A; 
seien Flächenelemente der groben Anfangs- 
unterteilung. Wenn A; in vier Teile A;ı, 
A;a, Ara und A;4 unterteilt wird, werden vier 
neue Formfaktoren F4.,A,: FA Ajı FAsA; 
und Fa4A; berechnet. Wenn A; ebenfalls 
in 4 Teile A;ı, Aj2, Aja und A;s unterteilt 
wird, werden weitere vier neue Formfaktoren 
FanAı FapAı FaA,sA: und FAA: berech- 
net. Es werden keine Formfaktoren zwischen 
Flächenelemente berechnet, die durch die 
Verfeinerung der Unterteilung neu entstan- 
den sind, F4,,4, Wird also beispielsweise 
Au Ar nicht berechnet. 





wird umso feiner in Flächenelemente aufgeteilt, je größere Strahlungsunter- 
schiede es aufweist, vgl. [CGIB86] und [Wat89]. Das Problem dabei besteht 
darin, daß man vor Berechnung der Strahlungswerte der einzelnen Flächenele- 
mente nicht weiß, in welchen Regionen große Strahlungsunterschiede auftreten 
werden. Man müßte das Verfahren zweimal anwenden: zuerst mit einer gro- 
ben Unterteilung zur Feststellung der Strahlungsunterschiede, dann mit einer 
anhand der errechneten Strahlungsunterschiede geeignet verfeinerten Untertei- 
lung, mit der auch die eigentliche Berechnung des Bildes vorgenommen wird. 
Dies hat den Nachteil, daß zur Berechnung der Strahlungsunterschiede bereits 
erhebliche Rechenzeit verbraucht wird. 


Eine Abhilfe bietet die in [CGIB86] vorgeschlagene nachträgliche Verfeinerung 
der Unterteilung: Man startet mit einer groben Unterteilung und berechnet 
anhand dieser für jedes Flächenelement einen Strahlungswert. In Regionen mit 
großen Strahlungsunterschieden werden dann die Flächenelemente weiter unter- 
teilt. Die Formfaktoren der dadurch neu entstehenden Flächenelemente werden 
mit der Halbwürfelmethode neu berechnet, wobei aber die grobe Anfangsun- 
terteilung zugrunde gelegt wird, vgl. Abbildung 9.7. Die Formfaktoren von 
nicht weiter unterteilten Flächenelementen werden nicht neu berechnet. Wenn 
die grobe Anfangsunterteilung N Flächenelemente verwendet, die verfeinerte 


M > N, gab es vor der Verfeinerung N- N Formfaktoren, danach gibt es M-N. 


Da nur für die neu entstandenen Flächenelemente neue Formfaktoren berech- 
net werden, werden auch nur für diese neue Strahlungswerte berechnet: Wenn 
Aı,''',An die Flächenelemente der Anfangsunterteilung sind und A,;, ein neu 
entstandenes Flächenelement, dann wird die von A,, abgegebene Strahlung 
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durch 


» 
| 


Eig+ Ri y, B;Fa,A; 


1 


E+R > B;F4.A; 


j=1 


berechnet. Damit kann die Strahlung von Unterelement A;, nach der Be- 
rechnung der Formfaktoren F4,,a, aus den Strahlungswerten der Flächenele- 
mente der Anfangsunterteilung berechnet werden. Die Strahlungsgleichung 
(9.4) braucht nicht neu gelöst zu werden. Die Unterteilung in Unterelemente 
wird so lange wiederholt, bis die gewünschte Genauigkeit erreicht ist. 


9.3 Methode der schrittweisen Verfeinerung 


Das Radiosity-Verfahren in der bis jetzt beschriebenen Form hat zwei für die 
praktische Verwendung große Nachteile: Der erste Nachteil besteht darin, daß 
das Ergebnis der Berechnung erst dargestellt werden kann, nachdem alle Form- 
faktoren bestimmt und nachdem das gesamte Gleichungssystem (9.4) gelöst 
ist. Vorher ist eine auch nur angenäherte Darstellung der gegebenen Szene 
nicht möglich. Dies macht das Konstruieren einer Szene durch einen Benutzer 
äußerst mühsam, weil er nach jeder vorgenommenen Änderung warten muß, 
bis der gesamte Berechnungsprozeß erneut durchlaufen wurde. Wünschens- 
wert für eine interaktive Konstruktion wäre es, wenn der Benutzer bereits nach 
kurzer Zeit eine einfache Näherungsdarstellung der Szene auf dem Bildschirm 
erhalten würde, die mit fortschreitender Berechnungszeit schrittweise verbessert 
wird. In der Konstruktionsphase könnte der Benutzer den Darstellungsprozeß 
zu einem frühen Zeitpunkt abbrechen, um neue Änderungen an der Geometrie 
der Szene vorzunehmen. Wenn der Konstruktionsprozeß beendet ist, könnte 
der Benutzer die sich schrittweise verbessernde Darstellung verfolgen und den 
Verbesserungsprozeß abbrechen, wenn er mit der Bildqualität zufrieden ist. 


Der zweite Nachteil besteht darin, daß die Anzahl der berechneten Formfak- 
toren quadratisch mit der Anzahl der verwendeten Flächenelemente wächst 
und daß alle Formfaktoren während des gesamten Berechnungsprozesses abge- 
speichert werden müssen. Damit hat das Verfahren neben einer quadratischen 
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Laufzeit auch einen quadratischen Speicherplatzbedarf‘. Eine Abhilfe für beide 
Nachteile bietet die in [ECWG88] vorgestellte Methode der schrittweisen Ver- 
feinerung, die mit linearem Speicherplatzbedarf auskommt und die bereits nach 
relativ kurzer Zeit eine Näherung der Darstellung auf den Bildschirm bringt, die 
dann schrittweise verbessert wırd. Der lineare Speicherplatzbedarf wird durch 
eine on-the-fly-Berechnung der Formfaktoren erreicht, d.h. es werden nicht alle 
Formfaktoren auf einmal berechnet und abgespeichert, sondern nur die gerade 
gebrauchten. Die frühe Darstellung der Näherung wird durch eine Änderung 
in der Berechnung des Gauß-Seidel-Verfahrens zur Lösung des Gleichungssy- 
stems (9.4) ermöglicht. Wir werden jetzt die Einzelheiten des Verfahrens näher 
beschreiben. 


In der bisher beschriebenen Version des Radiosity-Verfahrens wird das Gauß- 
Seidel-Verfahren zur Lösung des Gleichungssystems (9.4) verwendet. Dies ist 
ein iteratives Verfahren, bei dem die für die einzelnen Flächenelemente errechne- 
ten Strahlungswerte gegen die gesuchten Werte konvergieren. Die Auswertung 
der i-ten Zeile des Gleichungssystems liefert einen Schätzwert für den Strah- 
lungswert des Flächenelementes :, der auf den momentanen Schätzwerten der 
anderen Flächenelemente beruht: 


B;=E;+R, Y.B; Fi; (9.8) 


j=1l 


Man kann dies so auffassen, daß zur Bestimmung des Strahlungswertes B; für ı 
die von allen anderen Flächenelementen eintreffende Strahlung gesammelt wird. 
Ein einzelner Term R;B,; F;; in (9.8) beschreibt den Beitrag, den Flächenelement 
j zum Strahlungswert von : leistet. Man kann diesen Prozeß auch umdrehen, 
indem man bestimmt, welchen Beitrag : zu den Strahlungswerten aller anderen 
Flächenelemente der Szene leistet. Dies wird bei der Methode der schrittwei- 
sen Verfeinerung getan. Der Beitrag von : zum Strahlungswert eines beliebigen 
Flächenelementes j # : ist R;B; F;;. Durch Anwendung der reziproken Relation 
(9.2) läßt sich dieser Term umformen zu R;B; F};A;/A;. Man beachte, daß in 
diesem Term die für Flächenelement : errechneten Formfaktoren verwendet wer- 


den, d.h. die Formfaktoren, die durch Anwendung der Halbwürfelmethode auf 


“Die Formfaktoren werden in der Koeffizientenmatrix aus Gleichung (9.4) abgespeichert. 
Diese Matrix wird oft relativ dünn besetzt sein, weil viele Flächenelemente einander nicht 
sehen können. Nichtsdestotrotz übersteigt der Speicherplatzbedarf schnell ein akzeptables 
Maß: in [CCWG88] wird geschätzt, daß für eine Szene mit 50000 Flächenelementen ein 
Speicherplatzbedarf von einem Gigabyte erforderlich ist, wenn man annimmt, daß die Matrix 
zu 90% leer ıst und daß das Abspeichern eines Formfaktors 4 Byte erfordert. 
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Flächenelement : erhalten werden. Man braucht also zur Berechnung der Strah- 
lungswerte, die Flächenelement : zu allen anderen Flächenelementen leistet, nur 
einmal die Halbwürfelmethode anzuwenden und die mit den errechneten Form- 
faktoren erhaltenen Strahlungswerte zu den bisher aufsummierten Strahlungs- 
werten der entsprechenden Flächenelemente zu addieren. Dies kann man als 
Verteilen (shooting) der Strahlung von Flächenelement : in die Umgebung an- 
sehen. Nachdem ein Flächenelement seine Strahlung abgegeben hat, wird das 
Verfahren mit dem nächsten Flächenelement wiederholt. Ein Flächenelement 
kann wieder an die Reihe kommen, wenn es von anderen Flächenelementen 
Strahlung erhalten hat. 


Jeder Iterationsschritt des Verfahrens besteht aus der Durchführung des be- 
schriebenen Lösungsschritts für alle Flächenelemente. Jeder Lösungsschritt be- 
steht aus der Anwendung der Halbwürfelmethode auf ein Flächenelement und 
dem Aufsummieren der Beiträge dieses Flächenelementes zu den Strahlungs- 
werten der anderen Flächenelemente. Im Laufe der iterativen Lösung wird 
der Lösungsschritt für dasselbe Flächenelement : evtl. mehrmals wiederholt, 
so lange bis ein stabiler Zustand erreicht ist. Nach jedem auf : angewendeten 
Lösungsschritt wird der für : errechnete Strahlungswert genauer sein. Bei einer 
wiederholten Durchführung des Lösungsschritts für : werden die Strahlungs- 
werte der empfangenden Flächenelemente bereits den Beitrag der vorangehen- 
den Schätzung von B; enthalten. Deshalb braucht man nur die Differenz AB; 
zwischen der jetzigen und der vorangehenden Schätzung zu berücksichtigen. 
AB; kann als Vorrat der noch nicht abgegebenen Strahlung angesehen werden. 
Eine Programmskizze des Verfahrens ist in Abbildung 9.8 wiedergegeben. 


Die Berechnung der Formfaktoren braucht eigentlich nur im ersten Iterations- 
schritt zu erfolgen, wenn man die errechneten Formfaktoren abspeichert. Auf 
der anderen Seite kann man durch Vermeiden des Abspeicherns und durch eine 
Neuberechnung der Formfaktoren in jedem Iterationsschritt den Platzbedarf des 
Verfahrens linear in der Anzahl der beteiligten Flächenelemente halten, weil für 
jeden Lösungsschritt nur die Formfaktoren eines Flächenelementes gebraucht 
werden. 


Bei Verwendung der beschriebenen Methode liegt nach jedem Lösungsschritt 
für jedes Flächenelement eine neue Schätzung für den Strahlungswert vor, man 
kann also auch nach jedem Lösungsschritt eine Darstellung der Szene auf dem 
Bildschirm vornehmen. Diese Darstellung wird sich im Laufe des Iterationspro- 
zesses mit zunehmender Konvergenz des Verfahrens stetig verbessern. Wenn 
man immer zuerst diejenigen Flächenelemente der Szene bearbeitet, die das 
meiste Licht aussenden, erreicht man eine relativ schnelle Konvergenz des Ver- 
fahrens. Man erhält dann schon nach wenigen Lösungsschritten eine relativ 
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void progressive refinement (n,A,R,E); 
int n; float Aln], Rln], Ein]; 

{ 

int i,j; 

float B[n], F[n,n], deltaB[n], delta Rad; 


















init(B,deltaB,E); 
do { 
for (i=0; i<n; i++) do { 
F = compute ff(i); 
for (j=0; j<n; j++) do { 
deltaRad = Rlj]*deltaB[i]*Fli,jl*A[li]l / AlLj]; 
deltaB[j] = deltaB[j] + delta Rad; 
B[j] = B[j] + deltaRad; 


} 


deltaBli] = 0; 





} while (!convergent(deltaB)) 


} 


Abbildung 9.8: Programmskizze zum Verfahren der schrittweisen Verfeinerung: n ist 
die Anzahl der Flächenelemente der Szene. A[i] gibt den Flächeninhalt, R[Li] den Refle- 
xionskoeffizienten, E[i] den Eigen-Emissionswert von i an. In F[i,*] werden durch die 
Funktion compute_ff(i) die Formfaktoren von i zu allen anderen Flächenelementen der 
Szene berechnet. B[i] enthält den bisher errechneten Strahlungswert von Flächenelement 
i, delta_B[i] enthält den Differenzbetrag zwischen dem momentanen und dem vorhe- 
rigen Strahlungswert. Für Lichtquellen werden diese Werte durch init(B,delta.B,E) 
mit den Eigen-Emissionswerten initialisiert, für alle anderen Flächenelement wird mit 0 
initialisiert. In delta_Rad wird der Strahlungswert errechnet, den Flächenelement 7 von 
Flächenelement i empfängt. convergent(delta.B) ist eine boolesche Funktion, die 
in Abhängigkeit von einem vorgegebenen Schwellenwert bestimmt, ob der gewünschte 
Konvergenzpunkt bereits erreicht ist. 
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gute Darstellung der Szene auf dem Bildschirm. Aus diesem Grund wird immer 
das Flächenelement : zuerst bearbeitet, das den größten Wert AB;A; besitzt. 
Dieser Wert gibt den noch nicht ausgesandten Energiewert von Flächenelement 
i an. In den ersten Lösungsschritten sind dies üblicherweise die Lichtquellen, 
weil alle anderen Flächenelemente den Anfangs-Strahlungswert 0 haben. 


Die dargestellten Zwischenbilder werden sich, ausgehend von einer dunklen Um- 
gebung, nach und nach immer weiter aufhellen, weil immer mehr Licht in der 
Szene verteilt wird. Trotz der relativ schnellen Konvergenz wird während der 
ersten Schritte die Beleuchtung der Szene recht schlecht dargestellt, weil nur die 
direkte Beleuchtung der bereits bearbeiteten Lichtquellen berücksichtigt wird, 
die indirekte Beleuchtung wird dagegen erst später in die Darstellung einfließen. 
Um die Darstellung der ersten Bilder zu verbessern, wird in [CCWGS88] vorge- 
schlagen, einen Umgebungsterm zu verwenden, der zu den bisher errechneten 
Strahlungswerten der Flächenelemente hinzuaddiert wird. Dieser Umgebungs- 
term wird nur für die Darstellung auf dem Bildschirm hinzugefügt und beein- 
flußt die Berechnung der Strahlungswerte der einzelnen Flächenelemente nicht. 
Üblicherweise verwendet man einen Umgebungsterm, der mit fortschreitender 
Iteration immer weiter abnimmt. 


Der in [CCWG88] verwendete Umgebungsterm stützt sich auf eine Abschätzung 
der Formfaktoren, die den Formfaktor von Flächenelement : zu 5 als 


für ein beliebiges © berechnet. Der errechnete Wert ist unabhängig von :. Damit 
kann man einen mittleren diffusen Reflexionskoeffizienten R,,, als das mit den 
abgeschätzten Formfaktoren gewichtete Mittel der Reflexionskoeffizienten der 
einzelnen Flächenelemente errechnen: 


ksı Ak 


Von einer in die Umgebung abgeschickten Energiemenge wird im Mittel der 
Bruchteil R.,, reflektiert werden, von dieser reflektierten Energiemenge wird in 
Mittel wieder der Bruchteil R,., reflektiert, dies ist der Bruchteil R},, der ur- 
sprünglichen Energiemenge usw. Damit läßt sich ein Gesamt-Reflexionsfaktor 


R als geometrische Summe errechnen: 


Raus = 


1 
l- Raus 





R=1+ Rau + Rays + Raus + = 
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Den Umgebungsterm I, berechnet man als Summe der noch nicht in die Um- 
gebung abgegebenen Strahlungswerte, die gewichtet werden mit der Fläche der 
Flächenelemente, auf denen die Strahlung vorliegt. Um den Effekt mehrfa- 
cher Reflexionen zu berücksichtigen, wird diese gewichtete Summe mit dem 
Gesamt-Reflexionsfaktor multipliziert: 


= RY \AB;F;=R SA, 
=1 


j=l 


Wenn B; der für ein Flächenelement : bisher errechnete Strahlungswert ist, wird 
für die Bildschirmdarstellung von : der Strahlungswert, 


B; =B; + Rıla 


verwendet. B! wird nur für die Bildschirmdarstellung verwendet, der Umge- 
bungsterm wird nicht zu dem noch abzugebenden Strahlungswert AB; addiert. 
Da mit Fortschreiten der Iteration die auf den einzelnen Flächenelementen lie- 
gende, noch nicht abgegebene Strahlung abnimmt, nimmt auch der Wert des 
Umgebungsterms mit Fortschreiten der Iteration ab, vgl. (9.9). 


Die im letzten Abschnitt beschriebene adaptive Unterteilung der Flächenele- 
mente kann auch hier angewendet werden: Wenn ein empfangendes Flächen- 
element einen zu großen Strahlungsunterschied aufweist, wird es in Unterele- 
mente unterteilt. Nach der Unterteilung wird die aufgenommene Strahlung 
für jedes Unterelement gesondert berechnet. Es werden daher bei Anwen- 
dung der Halbwürfelmethode auf ein Flächenelement : die Formfaktoren zu 
den Unterelementen berechnet. Die Halbwürfelmethode wird aber nur auf die 
Flächenelemente der ursprünglichen Unterteilung, nicht auf die neu entstan- 
denen Unterelemente angewendet. Für die Bildschirmdarstellung werden die 
Unterelemente mit der Gouraud-Methode, vgl. Abschnitt 6.1, schattiert, wo- 
bei die Strahlungswerte für die Eckpunkte der Unterelemente wie in Abschnitt 
9.1 beschrieben durch Extrapolation berechnet werden. Abbildung 9.9 faßt das 
Gesamtverfahren noch einmal zusammen. 
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void progressive refinement (n,m,A,Au,R,E); 
int n,m; | 
float Aln], Auln,m], R[n], Eln]:; 


{ 


int i,j,k; 


float B[n],F[n,n,m] ‚delta B[n],delta Rad, 


uln],‚Buln,m] ,B_screen[n,m] ‚Ia; 


= compute ambient(); 


for (j=0; j<n; j++) do { 


} 


deltaBl[j] = Elj]; 
for (k=0; k<ulj]; k++) do Bulj,k] = Elj]; 


= select_patch(); 
compute_ff(i); 
(j=0; j<n; j++) do { 
for (k=0; k<ulj]; k+t+) do { 
deltaRad = Rlj]*deltaB[i]*F[i,j,k]*A[i]/Aulj,k]; 
delta Bl[lj) = delta B[j] + deltaRad*Aulj,kJ/A[j]; 
Bulj,k] = Bulj,k] + delta Rad; 
B_screen[j,k] = Bulj,k] + R[j] * I.a; 
} 
} 
for (j=0; j<n; jt+) do { 
for (k=0; k<ulj]; k++) do { 
compute_vertex radiosities(j,k); 
if (gradient too high(j,k)) 
subdivide(j,k); 
reshoot(i,j,k); 


} 


} 


} 


deltaBli] = 0; 
I_a = compute _ambient(); 
display(B_screen); 


} while (!convergent (deltaB)) 
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Abbildung 9.9: Programmskizze zum Verfahren der schrittweisen Verfeinerung: A[i], 
R[i], E[i], Bli], delta_B[i], delta_Rad und convergent(delta.B) haben die glei- 
che Bedeutung wie in Abbildung 9.8. Da jetzt auch Unterelemente betrachtet werden, 
kommen einige weitere Datenstrukturen hinzu: B_u[j,k] enthält den bisher errechne- 
ten Strahlungswert des Unterelementes k von Flächenelement j, im folgenden kurz 
als (j,k) bezeichnet. Aulj,k] ist der Flächeninhalt von (j,k), in B_screen[j,k] 
wird der für die Bildschirmdarstellung verwendete Strahlungswert von (j,k) berech- 
net. ulj] ist die Anzahl der bisher für j erzeugten Unterelemente, die inneren 
Schleifen laufen also über alle Unterelemente eines Flächenelementes. In I_a wird der 
Umgebungsterm abgespeichert, der durch die Funktion compute_ambient() berechnet 
wird. select_patch() liefert das Flächenelement i mit der größten noch nicht ausge- 
strahlten Energie AB;A;. compute_ff(i) berechnet die Formfaktoren von Flächenele- 
ment i zu allen Unterelementen, der Formfaktor von i zu Unterelement (5j,k) wird in 
F[i,j,k] abgelegt. compute vertex.radiosities(j,k) berechnet die Strahlungs- 
werte für die Eckpunkte von (j,k) durch Extrapolation. gradient-too.high(j,Kk) 
bestimmt, ob der Strahlungsgradient von (j,k) zu groß ist. Wenn dies der Fall ist, 
wird (j,k) durch subdivide(j,K) weiter in Unterelemente unterteilt und für jedes die- 
ser Unterelemente wird durch reshoot (i,j,k) ein geeigneter Strahlungswert berechnet. 
display(B_screen) dient zur Darstellung der Szene auf dem Bildschirm. 
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In [CCWG88] wird anhand einer Beispielszene? gezeigt, daß bei Bearbeitung 
der Flächenelemente in der beschriebenen Reihenfolge und bei Verwendung des 
Umgebungsterms sehr schnell ein recht gutes Näherungsbild der Szene auf dem 
Bildschirm dargestellt werden kann: bereits nach den ersten Lösungsschritten 
erreicht der Darstellungsfehler einen sehr geringen Wert. Bei Verwendung der 
Auflösung 150 x 150 für den Halbwürfel können die Formfaktoren eines Flächen- 
elementes in weniger als 10 Sekunden berechnet werden®, die Darstellung der 
Testszene auf dem Bildschirm dauert etwa 2 Sekunden. Damit ist das Verfah- 
ren durchaus in der Praxis einsetzbar, hat aber weiterhin den Nachteil, daß 
es nicht dynamisch auf Änderungen der Geometrie der vorliegenden Szene rea- 
gieren kann. Eine Änderungen der Geometrie erfordert eine komplette Neu- 
berechnung. In [Che90] wird versucht, diesen Nachteil zu beheben, indem das 
Verfahren zu einem interaktiven System ausgebaut wird. Die vorgeschlagene Er- 
weiterung stützt sich auf eine inkrementelle Berechnung der Strahlungswerte, 
die es erlaubt, die Oberflächenstruktur und die Geometrie der dargestellten 
Objekte während des Berechnungsprozesses zu ändern. Wenn eine Änderung 
vorgenommen wurde, werden nur die Strahlungswerte der durch die Änderung 
direkt betroffenen Flächenelemente sofort aktualisiert, alle anderen Flächenele- 
mente erfahren die Änderung durch die durch die Fortsetzung des Berechnungs- 
prozesses erreichte Propagierung der auf den manipulierten Flächenelementen 
angesammelten Strahlung. Dadurch wird vor allem für kleinere Änderungen 
der Szene eine große Rechenzeitersparnis erreicht. Ein Verfahren zur Beschleu- 
nigung der Konvergenz der Näherungsbilder ist in [RGG90] beschrieben. Das 
Verfahren beruht auf einer adaptiven Prozedur, die verschiedene Methoden zur 
Berechnung der Formfaktoren je nach prognostizierter Schnelligkeit einsetzt. 


9.4 Ray-Tracing- und Radiosity-Verfahren 


Das Radiosity-Verfahren in der bisher beschriebenen Form ist gut geeignet für 
die Darstellung von diffuser Reflexion. Spiegelnde Reflexion und Transmission 
läßt sich aber nicht gut wiedergeben. Dies liegt daran, daß das Radiosity- 
Verfahren für jedes Flächenelement einen Strahlungswert berechnet, der dann 
für die Bildschirmdarstellung verwendet wird. Dies ist für diffuse Reflexion aus- 
reichend, weil diffus reflektierte Strahlung in alle Raumrichtungen gleichmäßig 
abgegeben wird. Für spiegelnde Reflexion spielt dagegen der Winkel, unter 
dem ein Beobachter ein Flächenelement betrachtet, eine große Rolle. Dieser 


5Die Beispielszene enthält 500 Flächenelemente, die durch Anwendung der adaptiven Un- 
terteilung in 7000 Unterelemente unterteilt werden. 
6Dabei wurde eine Hewlett Packard 8255RX Workstation verwendet. 
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Winkel wird aber beim Radiosity-Verfahren gar nicht berücksichtigt, die er- 
rechneten Strahlungswerte sind unabhängig von der Position des Betrachters. 
Dies zeigt sich auch darin, daß bei einer Änderung der Position des Betrach- 
ters nur die Bildschirmdarstellung aktualisiert werden muß, die Bestimmung 
der Formfaktoren und das Lösen des Gleichungssystems brauchen nicht wieder- 
holt zu werden. Auf der anderen Seite wird spiegelnde Reflexion durch das in 
letzten Kapitel beschriebene Ray-Tracing-Verfahren sehr gut wiedergegeben. 
Das Ray-Tracing-Verfahren hat aber den Nachteil, diffuse Reflexion nicht gut 
darzustellen. 


Es liegt nahe, die beiden Verfahren miteinander zu kombinieren, um so ein Ver- 
fahren zu erhalten, mit dem sowohl diffuse als auch spiegelnde Reflexion und 
Transmission gut dargestellt werden können. Es reicht aber nicht aus, die Pi- 
xelintensitäten, die vom für die spiegelnde Reflexion zuständigen Ray-Tracing- 
Verfahren und vom für die diffuse Reflexion zuständigen Radiosity-Verfahren 
errechnet werden, einfach zu addieren, weil damit z.B. nicht berücksichtigt wird, 
daß das von einem Flächenelement z spiegelnd auf ein Flächenelement j reflek- 
tierte Licht dazu führt, daß 7 dieses Licht diffus zu benachbarten Flächenele- 
menten reflektieren kann, die dann entsprechend heller erscheinen. Das Kombi- 
nationsverfahren muß vielmehr in der Lage sein, den Lichttransport von diffuser 
zu diffuser, diffuser zu spiegelnder, spiegelnder zu diffuser und spiegelnder zu 
spiegelnder Reflexion mit in die Berechnung einzubeziehen. In [WCG87] wird 
ein Verfahren beschrieben, das dazu in der Lage ist, vgl. auch [FvDFH90] und 
[Wat89]. Das Verfahren besteht aus zwei Durchläufen. Im ersten Durchlauf wird 
ein Radiosity-Verfahren durchgeführt, das alle vier erwähnten Mechanismen für 
den Lichttransport berücksichtigt. Im zweiten Durchlauf wird ein Ray-Tracing- 
Verfahren angewendet, das die im ersten Durchlauf errechneten Strahlungswerte 
verwendet und den Lichttransport von diffuser zu spiegelnder und von spiegeln- 
der zu spiegelnder Reflexion berechnet. Die Intensität eines Pixels ergibt sich 
aus der Summe einer im ersten Durchlauf errechneten diffusen Komponente und 
einer im zweiten Durchlauf errechneten spiegelnden Komponente. Wir werden 
im folgenden die beiden Durchläufe etwas näher beschreiben. 


Das Standard-Radiosity-Verfahren muß zur Verwendung im ersten Durchlauf 
in zweierlei Beziehung geändert werden: zum einen muß neben der diffusen 
Reflexion auch die diffuse Transmission in die Berechnung miteinbezogen wer- 
den, zum anderen muß spiegelnde Reflexion und Transmission insoweit berück- 
sichtigt werden, wie sie die diffusen Komponenten der Flächenelemente beein- 
flußt. Diffuse Transmission wırd dadurch nachgebildet, daß man zusätzlich zu 
den bisher errechneten ( Vorwärts-)Formfaktoren noch sogenannte Rückwärts- 
Formfaktoren berechnet, indem man auch auf die Rückseite jedes Flächenele- 
mentes einen Halbwürfel legt. Die Rückwärts-Formfaktoren stellen den Effekt 
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| 
virtuelle Umgebung Ä wirkliche Umgebung 


Abbildung 9.10: Einführung einer virtuellen Umgebung zur Berücksichtigung des Licht- 
transports vom diffus reflektierenden Flächenelement j zum diffus reflektierenden Flächen- 
element i über das perfekt spiegelnd reflektierende Flächenelement k. Die Abbildung zeigt 
eine zweidimensionale Veranschaulichung. Das virtuelle Flächenelement 7’ wird bei der 
Berechnung der Formfaktoren zu : auf den Halbwürfel um : projiziert. 


dar, daß Licht von Flächenelementen, die auf der Rückseite eines durchschei- 
nenden Flächenelementes liegen, auf dessen Vorderseite diffus abgegeben werden 
kann. Spiegelnde Reflexion und Transmission wird ebenfalls durch die Berech- 
nung zusätzlicher Formfaktoren berücksichtigt: Für zwei diffus reflektierende 
Flächenelemente : und j, die voneinander Licht über ein spiegelndes Flächen- 
element k erhalten können, wird ein zusätzlicher Formfaktor berechnet, der den 
über k laufenden Lichttransport beschreibt. k wird als perfekt spiegelnd oder 
transmittierend angenommen. Die zusätzlichen Formfaktoren werden mit Hilfe 
einer virtuellen Umgebung berechnet, vgl. Abbildung 9.10, die durch k definiert 
ist und die bei der Berechnung der Formfaktoren für : ein zusätzliches Flächen- 
element 57’ enthält. Der von 5 indirekt über k zu : laufende Lichttransport 
wird durch den Formfaktor F;;, beschrieben, also als direkter Lichttransport 
zwischen 5’ und i. Durch Lösen des um die zusätzlichen Formfaktoren erweiter- 
ten Gleichungssystems werden für alle Flächenelemente diffuse Strahlungswerte 
berechnet, die auch spiegelnde Interaktionsphänomene berücksichtigen. Diese 
werden wie üblich auf die Eckpunkte der Flächenelemente übertragen. 


Im zweiten Durchlauf berechnet ein modifiziertes Ray-Tracing-Verfahren mit 
Hilfe der im ersten Durchlauf errechneten Strahlungswerte eine von der Position 
des Betrachters abhängige Darstellung der Szene. Dabei wird bei der Bestim- 
mung der lokalen Intensitätswerte eines Schnittpunktes zwischen Suchstrahl und 
einem Flächenelement : der Szene die Komponente für die diffuse Reflexion aus 
den im ersten Durchlauf für die Eckpunkte von : errechneten Strahlungswerten 
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mit bilinearer Interpolation berechnet. Um zusätzlich den Lichttransport von 
diffuser zu spiegelnder Reflexion zu berücksichtigen, muß man beachten, daß 
das von : spiegelnd reflektierte Licht prinzipiell auf : aus allen Raumrichtungen 
eintreffen kann. Üblicherweise kommt ein nennenswerter Beitrag aber nur aus 
einem relativ kleinen Raumbereich, dessen Orientierung von dem an : reflek- 
tierten Suchstrahl bestimmt wird und der umso schmaler ist, je spiegelnder : 
ist. In [WCG87] wird die Betrachtung aus Eflizienzgründen auf diesen Raum- 
bereich beschränkt. Zur genauen Berechnung der Intensitätswerte des aus dem 
Raumbereich einfallenden Lichtes muß bestimmt werden, welche Flächenele- 
mente vom betrachteten Punkt von : aus in dem Raumbereich sichtbar sind. 
Dazu wird in [WCG387] eine Pyramide verwendet, deren Spitze im betrachteten 
Schnittpunkt liegt und deren Mittellinie der reflektierte Suchstrahl ist, vgl. Ab- 
bildung 9.11. Die Grundfläche der Pyramide wird in ein Pixelnetz geringer 
Auflösung unterteilt (z.B. 10x10). Für jedes Pixel wird mit Hilfe eines z-Puffer- 
Algorithmus das sichtbare Flächenelement bestimmt. Die Intensität des durch 
das Pixel einfallenden Lichtes ist der Intensitätswert dieses Flächenelementes. 
Dieser Intensitätswert kann sowohl eine diffuse als auch eine spiegelnde Kompo- 
nente enthalten. Die diffuse Komponente wird mit bilinearer Interpolation aus 
den im ersten Durchlauf berechneten Strahlungswerten für die Eckpunkte des 
sichtbaren Flächenelementes j bestimmt. Eine eventuell vorhandene spiegelnde 
Komponente wird durch rekursive Anwendung des gesamten zweiten Durchlaufs 
auf j bestimmt, wie dies beim Ray-Tracing-Verfahren üblich ist. Zur Redu- 
zierung des Aufwands für die Rekursionsschritte kann neben den in Kapitel 8 
beschriebenen Techniken eine Verminderung der Auflösung des Pixelgitters auf 
der Grundfläche der Pyramide bei fortschreitender Rekursionstiefe dienen. Die 
für die Pixel der Pyramide bestimmten Intensitätswerte werden mit einem von 
der Lage der Pixel abhängigen Gewichtswert multipliziert und aufsummiert. 
Die Summe wird zu dem errechneten lokalen Intensitätswert addiert, die Ge- 
samtsumme bestimmt den auf dem Bildschirm darzustellenden Intensitätswert. 
Spiegelnde Transmission wird durch Verwendung einer Transmissions-Pyramide 
berechnet. 


In [SAWG91] wird eine Modifikation des Zweischrittverfahrens vorgeschlagen, 
die die im ersten Durchlauf enthaltene Beschränkung aufhebt, daß das zwischen 
zwei diffus reflektierenden Flächenelementen vermittelnde Flächenelement als 
perfekt spiegelnd angenommen wird. Dazu wird im ersten Durchlauf zu jedem 
Flächenelement statt einem einzelnen Intensitätswert eine richtungsabhängige 
Intensitätsverteilung berechnet, die durch sphärische harmonische Funktionen 
dargestellt wird und mit der im Prinzip ein beliebiges Reflexionsverhalten be- 
schrieben werden kann. In [SAWG91] wird die Intensitätsverteilung aber nur zur 
Beschreibung “diffuser Intensität” verwendet, weil dann die Intensitätsvertei- 
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Abbildung 9.11: Zur Bestimmung der von einem Punkt 5 auf einem Flächenelement i 
in Richtung V abgegebenen Lichtintensität wird eine Richtungspyramide mit Spitze in 5 
und Mittellinie R verwendet. 


lungen relativ glatt sind und weniger Speicherplatz zur Ablage der Koeflizienten 
der sphärischen harmonischen Funktionen gebraucht wird. Zur Berechnung der 
Intensitätsverteilung wird das in 9.3 beschriebene Verfahren der schrittweisen 
Verfeinerung erweitert: Die von einem Flächenelement : an ein Flächenelement 
j abgegebene Strahlung wird aus einer auf : angesammelten Intensitätsvertei- 
lung berechnet. Der genaue Wert der abgegebenen Strahlung ist dabei von 
dem Winkel abhängig, unter dem j von t aus sichtbar ist. Die auf j ankom- 
mende Strahlung wird zur Intensitätsverteilung von 7 unter der eintreffenden 
Richtung addiert. Spiegelnd reflektiertes Licht wird nicht in die Intensitätsver- 
teilung aufgenommen. Statt dessen wird es direkt zu anderen Flächenelementen 
weitertransportiert. Dies wird in [SAWG91] durch Einführung eines virtuellen 
Flächenelementes :’ erreicht, das durch Spiegelung von : an der Ebene entsteht, 
die das spiegelnde Flächenelement k enthält, und das die gespiegelte Inten- 
sıtätsverteilung von : erhält, vgl. Abbildung 9.12. Das von : zu k gelangte Licht 
wird dadurch zu anderen Flächenelementen der Szene weitertransportiert, daß 
i als abgebendes Flächenelement behandelt wird. Dabei treten aber nur die 
Flächenelemente als Ziel auf, die ı in k sehen können. Dieses Vorgehen hat 
im Vergleich zu der oben beschriebenen Methode der virtuellen Umgebung den 
Vorteil, daß nur ein Flächenelement und nicht die gesamte Szene gespiegelt 
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werden muß. Deshalb können sogar mehrfache spiegelnde Reflexionen durch re- 
kursives Erzeugen von virtuellen Flächenelementen nachgebildet werden. Eine 
Programmskizze des ersten Durchlaufs ist in Abbildung 9.13 wiedergegeben. 
Als zweiter Durchlauf wird wieder ein Ray-Tracing-Verfahren verwendet, bei 
dem die für einen Schnittpunkt $ zwischen Suchstrahl und einem Flächenele- 
ment : der Szene zu bestimmende lokale Intensität aus der im ersten Durchlauf 
errechneten Intensitätsverteilung bestimmt wird. Der durch ideale spiegelnde 
Reflexion entstehende Beitrag zur Intensität von 5 wird wie üblich durch rekur- 
sive Aufrufe des Ray-Tracing-Verfahrens errechnet. Eine Richtungspyramide 
wird nicht verwendet, weil im ersten Durchlauf bereits die Auswirkung von 
mehrfacher spiegelnder Reflexion auf die diffusen Intensitäten berücksichtigt 
wurde. 


Der Nachteil des Verfahrens liegt in dem enormen Speicherplatzbedarf. Trotz 
Beschränkung der Intensitätsverteilung auf die Beschreibung diffuser Intensität 
müssen für jede Intensitätsverteilung zwischen 150 und 250 Koeffizienten ab- 
gespeichert werden, pro Flächenelement braucht man also etwas weniger als 
1 Kilobyte zur Abspeicherung der Intensitätsverteilung’. In [SAWG91] wird 
für eine Beispielszene mit etwa 30000 Flächenelementen eine Laufzeit von 
5 Minuten? für die Verteilung der auf einem Flächenelement angesammelten 
Lichtmenge genannt. Auch dies ist im Vergleich zu den für das Originalverfah- 
ren der schrittweisen Verfeinerung erhaltenen Werten recht hoch. Gegenüber 
dem Verfahren aus [WCG87] hat diese Variante aber wegen der Verwendung 
der Methode der schrittweisen Verfeinerung den Vorteil, relativ schnell eine 
Näherungsdarstellung auf den Bildschirm zu bringen. 


Weitere Kombinationsverfahren von Ray-Tracing- und Radiosity-Verfahren, 
auf die wir hier nicht näher eingehen können, sind in [SP89], [WEH89] und 
ICRMT91] beschrieben. 


9.5 Zusammenfassung und Ausblick 


Das in diesem Abschnitt beschriebene Radiosity-Verfahren ist sehr gut zur Dar- 
stellung diffuser Reflexion geeignet. Dazu ist jedoch ein enormer Einsatz an 
Rechenzeit und Speicherplatz erforderlich. Die in 9.3 beschriebene Methode 
der schrittweisen Verfeinerung beseitigt den Nachteil, daß erst am Ende des 
Berechnungsprozesses eine Darstellung auf dem Bildschirm erfolgen kann, was 


"Das Originalverfahren braucht nur 4 Byte, weil es nur einen Intensitätswert abspeichert. 
®gemessen auf einer Apollo DN10000 mit 64 MByte Haupspeicher 
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Abbildung 9.12: Die von einem Flächen- 
element : über ein spiegelndes Flächenele- 
ment k zu einem Flächenelement 7 trans- 
portierte Strahlung wird durch Einführung 
eines virtuellen Flächenelementes i’ berück- 
sichtigt, das seine Strahlung direkt an 5 wei- 
tergibt. 





void first _pass(n); 

int n; 

{ 

int i; 

do { 
i = select patch(); 
shoot(i,n); 

} while (!convergent()); 










} 


Abbildung 9.13: Programmskizze zum ersten Durchlauf des modifizierten Zweischritt- 
verfahrens nach [SAWG91]. select_patch(), convergent() und n haben die gleiche 
Bedeutung wie in Abbildung 9.9. Der eigentliche Vorgang der Energieabgabe ist in der 
Prozedur shoot zusammengefaßt, damit diese rekursiv aufgerufen werden kann. Diese 
ist in Abbildung 9.14 wiedergegeben. 
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void shoot (i,n); 

int i,n; 

{ 

int j; 

float I,phi,I.distr[n]; 


for (j=0; j<n; j++) do { 
if (is visible(i,j)) { 
phi = angle(i,j); 
I = incident flux(I_distr[i],‚phi); 
update(I distr[j],I,phi); 
if (is_specular(j)) flag(j); 


} 
for (j=0; j<n; j++) do { 
if (is flagged(j)) { 
ji’ = build virtual(i,j); 
shoot(i’); 





Abbildung 9.14: Skizze der in Abbildung 9.13 verwendeten Prozedur shoot. 
is_visible(i,j) stellt fest, ob Flächenelement j von i aus gesehen werden kann, 
angle(i,j) bestimmt den zugehörigen Winkel. In I_distrli] ist die Inten- 
sitätsverteilung von i abgelegt. incident flux(I_distrli],phi) bestimmt die 
von der Intensitätsverteilung I_distr[i] in Richtung phi abgegebene Strahlung. 
update(I_distr[j],I,phi) addiert den Teil dieser Strahlung, der von 5 nicht spiegelnd 
weitergegeben wird, zu der Intensitätsverteilung von j. Wenn j einen spiegelnden Anteil 
hat, was durch is_specular(j) festgestellt wird, wird j mit flag(j) markiert. Für 
jedes markierte Flächenelement wird in der zweiten Schleife durch build virtual(i,j) 
ein virtuelles Flächenelement :' erzeugt, das durch Spiegelung von i an der Ebene, die 5 
enthält, entsteht. Die von j spiegelnd weitergegebene Strahlung wird durch den rekursiven 
Aufruf shoot (i’) weiterverteilt. 
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für eine interaktive Modellierung von Szenen sehr hinderlich ist. Die in 9.4 be- 
schriebenen Kombinationsverfahren von Ray-Tracing- und Radiosity-Methode 
ermöglichen die realistische Darstellung von Szenen, die sowohl diffuse als auch 
spiegelnde Reflexion enthalten. Mit diesen Kombinationsverfahren sind die bis 
heute realistischsten Bilder erzeugt worden. 


Das wichtigste Ziel bei der Weiterentwicklung der Radiosity-Verfahren wird 
neben einer weiteren Verbesserung der Wirklichkeitstreue der erzeugten Bilder 
in der Beschleunigung der beschriebenen Verfahren liegen. Den größten Fort- 
schritt verspricht dabei wie beim Ray-Tracing-Verfahren eine Parallelisierung. 
Ein einfaches Verfahren zur Parallelisierung der Methode der schrittweisen Ver- 
feinerung ist in [RGG90] beschrieben: Von n Prozessoren dient einer als Ser- 
ver, einer als Display-Prozessor, die restlichen n — 2 Prozessoren werden als 
Clients eingesetzt. Jeder Prozessor erhält eine komplette Beschreibung der dar- 
zustellenden Szene, aber nur der Server speichert die Strahlungswerte zu den 
Flächenelementen ab. Das Verfahren besteht aus Runden, die so lange aus- 
geführt werden, bis Konvergenz erreicht ist. Zu Beginn jeder Runde bestimmt 
der Server die n — 2 Flächenelemente mit der größten noch nicht abgegebenen 
Strahlungsenergie und schickt jedem Client eines dieser Flächenelemente. Jeder 
Client berechnet die Formfaktoren von dem ihm zugewiesenen Flächenelement 
ı zu allen anderen Flächenelementen der Szene und schickt diese an den Ser- 
ver. Der Server berechnet daraus neue Strahlungswerte für die Flächenelemente 
durch Verteilen der auf : angesammelten Strahlung. Die Bildschirmdarstellung 
wird dadurch aktualisiert, daß der Server ab und zu die errechneten Strah- 
lungswerte an den Display-Prozessor schickt. Das Verfahren erweist sich laut 
[RGG90] für ein Netz mit einer kleinen Anzahl leistungsfähiger Workstations® 
recht gut einsetzbar, die Effizienz nimmt aber mit steigender Anzahl von Clients 
etwa linear ab. Bei zehn Clients liegt sie je nach Szene bei etwa 0.6. 
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Kapitel 10 


Schatten und 
Oberflächenstrukturen 


Zur Erzeugung von realitätsnahen Darstellungen ist die Erzeugung von Schatten 
und Oberflächenstrukturen sehr wichtig. Die Darstellung von Schatten schafft 
einen Bezug zwischen den dargestellten Objekten und dem umgebenden Raum, 
der üblicherweise aus Boden und Seitenwänden besteht. Die Darstellung von 
Oberflächenstrukturen nimmt den Objekten ihr unnatürlich glattes Aussehen 
und macht sie damit den in der Realität auftretenden Objekten ähnlicher. 


10.1 Erzeugung von Schatten 


Bei den in den Kapiteln 8 und 9 beschriebenen globalen Verfahren (Ray- 
Tracing-Verfahren und Radiosity-Verfahren) werden die Schatten von alleine 
mitgeliefert: Beim Ray-TIracing-Verfahren wird durch Verwendung eines Schat- 
tenfühlers bestimmt, ob ein Punkt einer Objektoberfläche im Schatten liegt 
oder direkt von der Lichtquelle beleuchtet wird. Beim Radiosity-Verfahren wer- 
den Schatten bei der Berechnung der Formfaktoren dadurch berücksichtigt, daß 
Lichtquellen als Oberflächenelemente behandelt werden. Wenn ein Oberflächen- 
element i bzgl. eines Lichtquellen-Oberflächenelementes 5 im Schatten liegt, 
wird dies bei der Berechnung der Formfaktoren mit der Halbwürfelmethode fest- 
gestellt: Die Projektion von j auf den Halbwürfel von : wird von der Projektion 
eines anderen Oberflächenelementes k überdeckt, das zwischen : und 5 liegt. Bei 
Verwendung von lokalen Methoden wie Gouraud- oder Phong-Schattierung zur 
Darstellung der Objekte müssen dagegen die Schatten zusätzlich erzeugt wer- 
den. 
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Das Aussehen eines von einem Objekt geworfenen Schatten ist abhängig von 
der Größe, der Ausdehnung und der Position der Lichtquelle. Man unterschei- 
det den Kernschattenbereich und den Halbschattenbereich. Als Kernschatten 
bezeichnet man den Bereich, in den von der Lichtquelle aus kein direktes Licht 
fällt. Als Halbschatten bezeichnet man den Bereich, der nur von einem Teil 
der Lichtquelle direkt beleuchtet wird. Für punktförmige Lichtquellen kann 
kein Halbschatten auftreten. Der Halbschattenbereich umgibt den Kernschat- 
tenbereich und ist umso größer, je größer die Ausdehnung der Lichtquelle ist 
und je näher sie zum Objekt liegt. Wir werden im folgenden annehmen, daß 
punktförmige Lichtquellen verwendet werden und brauchen uns daher nicht um 
die Erzeugung von Halbschatten zu kümmern. 


Die Position des Beobachters spielt für die Lage der Schatten keine Rolle. Eine 
Veränderung der Beobachterposition ändert die erzeugten Schatten nicht. Der 
Schattenwurf ändert sich nur dann, wenn die Lage des Objektes oder der Licht- 
quelle geändert wird. Wenn die Beobachterposition mit der Position der Licht- 
quelle zusammenfällt, kann der Beobachter keine Schatten wahrnehmen. 


10.1.1 Bodenschatten für einzelne Objekte 


Wir werden in diesem Abschnitt ein sehr einfaches Verfahren vorstellen, mit 
dem Bodenschatten für einzelne Objekte erzeugt werden können, vgl. [Bli89a], 
[Wat89]. Das Verfahren ist auch auf Szenen mit mehreren Objekten anwendbar, 
wenn diese so weit voneinander entfernt sind, daß sie keine Schatten aufeinander 
werfen. 


Das Verfahren nimmt an, daß der Boden durch eine Ebene beschrieben wird. 
Die Idee besteht darin, eine Projektion des darzustellenden Objektes auf diese 
Ebene zu berechnen, vgl. Abbildung 10.1. Wenn man eine punktförmige, im 
Unendlichen liegende Lichtquelle verwendet, werden die Lichtstrahlen durch 
einen Vektor L = (z1,yı,21) beschrieben. Wenn P = (£p, Yp, 2p) ein beliebiger 
Punkt des Objektes ist, dann ist 


ö=P-al (10.1) 


die Gleichung des durch P verlaufenden Projektors mit Richtung L. Wenn 
die Bodenebene mit der Ebene z = 0 zusammenfällt, erhält man den Schnitt- 
punkt 5 = (x,,y,,0) des Projektors mit der Ebene, indem man aus der z- 
Komponente von (10.1) den Parameterwert & = z,/zı berechnet und in die x- 
und y-Komponente einsetzt. Es ergibt sich: 
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Abbildung 10.1: Ein Punkt P ei- 
nes Objektes wird mit Hilfe eines aus 
Richtung Z eintreffenden Projektors 
auf einen Punkt $ der Bodenfläche 





abgebildet. 
we el 


Diese Berechnung läßt sich durch folgende Matrixoperation beschreiben: 


x, 10 -z/za 0 E; 
Ys = 0 1 yılzı 0 Yp 
2 00 0 0 %p 
1 0 0 0 1 1 


Damit läßt sich der Schattenwurf eines einzelnen Objektes durch eine einfache 
Matrixoperation darstellen, die auf die Punkte des Objektes angewendet wird. 
Durch Anwendung dieser Operation auf die Eckpunkte des darzustellenden Ob- 
jektes erhält man die Eckpunkte eines in der Bodenebene liegenden Polygons, 
das die Umrisse des geworfenen Schattens angibt. 


10.1.2 Scangeraden-Algorithmus mit Schattenberech- 
nung 


Ein einfaches Verfahren zur Erzeugung von Schatten ist ein in zwei Schrit- 
ten arbeitender Scangeraden-Algorithmus, vgl. [App68], [BK70], [Wat89], 
[FvDFH90]. Im ersten Schritt wird eine Datenstruktur aufgebaut, die zu je- 
dem Polygon P alle Polygone angibt, die einen Schatten auf P werfen können. 
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Beobachter 


Abbildung 10.2: Veranschaulichung des Scangeraden-Algorithmus mit Schattenberech- 
nung. S(P) und Sg(P) sind der Übersichtlichkeit wegen etwas versetzt gezeichnet. 


Zum Aufbau dieser Datenstruktur werden alle Polygone auf eine Kugel proji- 
ziert, deren Mittelpunkt in der Lichtquelle liegt. Polygone, deren Projektionen 
sich überlappen, können Schatten aufeinander werfen und werden in die Daten- 
struktur aufgenommen. Die maximale Größe der Datenstruktur ist O(n?). Der 
zweite Schritt besteht aus einem Scangeraden-Algorithmus zur Bestimmung der 
sichtbaren Oberflächen, vgl. Abschnitt 4.4, der bei der Bearbeitung einer Scan- 
geraden die im ersten Schritt aufgebaute Datenstruktur durchläuft. Sei P das 
sichtbare Polygon und sei S(P) das zur aktuellen Scangerade gehörende Gera- 
densegment von P, das dadurch entsteht, daß P mit der Scanebene! geschnitten 
wird. Wenn die Liste der schattenwerfenden Polygone zu P leer ist, läuft der 
Scangeraden-Algorithmus wie gewohnt ab: S(P) wird mit dem Farbwert von 
P dargestellt. Wenn es ein schattenwerfendes Polygon Q zu P gibt, wird Q mit 
der durch S(P) und die Position der Lichtquelle verlaufenden Ebene geschnit- 
ten. Das resultierende Geradensegment S(Q) wird dann auf die Ebene, die P 
enthält, projiziert, wobei die Position der Lichtquelle als Projektionszentrum 
verwendet wird, vgl. Abbildung 10.2. Das so erhaltene Geradensegment Sg (P) 
liegt auf der gleichen, in der Scanebene verlaufenden Gerade wie S(P). Je nach 


Lage von S(P) und $Sg(P) sind drei Fälle zu unterscheiden: 


!Die Scanebene enthält die in der Projektionsebene verlaufende. Scangerade und das 
Projektionszentrum. 
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1. Wenn $(P) und $Sg(P) nicht überlappen, kann Q für die betrachtete Scan- 
gerade keinen Schatten auf P verursachen. S(P) wird mit dem Farbwert 
von P dargestellt. 


2. Wenn S(P) von Sg(P) ganz überdeckt wird, liegt P für die betrach- 
tete Scangerade ganz im Schatten, S(P) wird als im Schatten liegend 
dargestellt. 


3. Wenn S(P) von Sg(P) teilweise überdeckt wird, wird der überdeckte Teil 
von S(P) als im Schatten liegend dargestellt, der nicht überdeckte Teil 
von S(P) wird mit dem Farbwert von P dargestellt. 


Das beschriebene Verfahren wird für alle Polygone Qı,...,Q„ wiederholt, die 
Schatten auf P werden können. Die Teile von $(P), die von mindestens einem 
Sg; überdeckt werden, liegen in Schatten. 


Weitere Algorithmen zur Erzeugung von Schatten, auf die wir hier nicht oder 
nur kurz eingehen können, sind in |FvDFH90] beschrieben. [AWG78] beschreibt 
einen Zwei-Schritt-Algorithmus, der die Schattenberechnung vor der Bestim- 
mung der sichtbaren Oberflächen durchführt. Im ersten Schritt wird bestimmt, 
welche Oberflächenteile von der Lichtquelle aus sichtbar sınd. Nicht sichtbare 
Teile liegen im Schatten. Im zweiten Schritt wird mit dem gleichen Algorith- 
mus bestimmt, welche Oberflächenteile von der Betrachterposition aus sichtbar 
sind. Von der Betrachterposition aus sichtbare Oberflächenteile, die von der 
Lichtquelle aus nicht sichtbar sind, liegen im Schatten. Da der Schattenwurf 
von der Betrachterposition unabhängig ist, braucht bei Änderung der Betrach- 
terposition nur der zweite Schritt wiederholt zu werden. [Cro77] stellt einen 
Algorithmus vor, der für jedes Objekt ein Schattenvolumen bestimmt, das ist 
der Bereich der Szene, den das Objekt von der Lichtquelle verdeckt. Die Sei- 
tenflächen des Schattenvolumens werden als als unsichtbare Schattenpolygone 
behandelt. Abhängig von der Betrachterposition unterscheidet man vordere 
und hintere Schattenpolygone. Bei der Bestimmung der sichtbaren Oberflächen 
werden die Schattenpolygone zur Bestimmung der im Schatten liegenden Ob- 
jektteile verwendet: Ein Oberflächenteil, das von mehr vorderen als hinteren 
Schattenpolygonen verdeckt wird, liegt im Schatten. [Ber86] beschreibt eine 
Implementierung des Verfahrens. [CF89] und [Chi90] beschreiben eine für die 
Methode der Objektmodellierung einsetzbare Variante, vgl. auch Abschnitt 8.8. 
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10.2 Erzeugung von Oberflächenstrukturen 


Die Anwendung der in Kapitel 5 beschriebenen Reflexionsmodelle erzeugt Dar- 
stellungen von Objekten, für die zwar die Beleuchtungsverhältnisse im Normal- 
fall recht gut wiedergegeben sind, die aber im Gegensatz zu den in der Realität 
zu beobachtenden Objekten keinerlei Oberflächenstruktur aufweisen. Die darge- 
stellten Objekte erscheinen vollkommen eben. Ziel der in diesem Abschnitt be- 
sprochenen Methoden ist es, die dargestellten Objekte dadurch realistischer er- 
scheinen zu lassen, daß sie mit einer Oberflächenstruktur versehen werden. Der 
Begriff Oberflächenstruktur (englisch: texture) ist dabei sehr allgemein zu se- 
hen. Er schließt Materialstrukturen wie Holz, Marmor oder Fels ebenso ein wie 
die wiederholte Abbildung eines fest vorgegebenen Musters auf die Oberfläche 
(Parkettierung). In [Hec86] wird das Erzeugen von Oberflächenstrukturen als 
Abbildung von einem Strukturraum in den Objektraum beschrieben. Der Struk- 
turraum kann ein-, zwei- oder dreidimensional sein. Ein eindimensionaler 
Strukturraum wird beispielsweise zur Darstellung von Gesteinsschichten ver- 
wendet, zweidimensionale Strukturräume werden zur Modellierung von Wellen 
oder Pflanzen verwendet, mit dreidimensionalen Strukturräumen können Holz- 
oder Marmorstrukturen nachgebildet werden. Wir werden im folgenden auf 
die verschiedenen Verfahren eingehen. Nach der Abbildung der Struktur auf 
eine Oberfläche im dreidimensionalen Objektraum wird diese wie in Kapitel 3 
beschrieben auf den Bildschirm abgebildet. 


Man beachte, daß die Erzeugung von Oberflächenstrukturen auch für die glo- 
balen Verfahren wie Ray-Tracing- oder Radiosity-Verfahren anwendbar und 
sinnvoll ist. 


10.2.1 Dreidimensionale Strukturierungstechniken 


Wir werden in diesem Abschnitt eine dreidimensionale Strukturierungstech- 
nik vorstellen, mit der Materialien wie Holz oder Marmor nachgebildet werden 
können, vgl. [Per85], [Pea85], [Wat89]. Das Verfahren beruht auf der Annahme, 
daß zu jedem Punkt (z,y,z) des Objektraumes ein Strukturwert T(x,y,z) de- 
finiert ist. Damit kann man sich den Objektraum als festen Block mit einer 
inneren Struktur vorstellen, aus dem die Objekte herausgeschnitten werden. Je 
nach Lage der Oberflächenpunkte ergibt sich ein anderer Strukturwert.?2 Für 


2Vorsicht ist bei Animationssequenzen geboten: Wenn Objekte sich durch den Raum be- 
wegen, muß die Struktur des Objektraumes diese Bewegung mitmachen, damit die Oberfläche 
ihre Struktur behält. 
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eine eventuelle Implementierung verwendet man am besten eine geeignete Struk- 
turfunktion, die zu jedem Punkt des Objektraumes den zugehörigen Struktur- 
wert zurückliefert. 


Eine Holzstruktur kann als Menge von konzentrischen Zylindern (Jahres- 
ringe) beschrieben werden, die zwischen dunklem und hellem Holz wechseln, 
vgl. [Pea85], [Wat89]. Die Mittellinie der Zylinder wird gegen eine evtl. vor- 
handene Symmetrieachse des darzustellenden Objektes gekippt. Um der Ob- 
jektstruktur ein unregelmäßiges Aussehen zu geben, stört man die Oberflächen 
der Zylinder zusätzlich mit einer harmonischen Funktion. Für eine Implemen- 
tierung wird in [Wat89] vorgeschlagen, eine Funktion tilt zu verwenden, die 
angewendet auf einen Punkt (x,y,z) des Objektraumes einen Punkt (u,v, w) 
des Strukturraumes liefert und die auch die gewünschte Kippung durchführt. 
Den Farbwert zu (z,y,z) erhält man durch Anwendung einer Funktion wood 
auf (u,v,w), die in Abbildung 10.3 skizziert ist. Wenn die Zylinder wie in Ab- 
bildung 10.4 wiedergegeben angeordnet sind, ist r = yu? + w? der Radius des 
Zylinders, auf dem der Punkt (u,v, w) liegt. Für den Winkel & aus Abbildung 
10.4 gilt tana = u/w für w # 0 und deswegen auch @ = arctanu/w. Für 
v=-0undu>hista=l(, füw=0undu<Dist a = m. In [Wat89] 
wird vorgeschlagen, dem Radius eine sinusförmige Störfunktion 2sin(20«) zu 
überlagern. Zusätzlich wird eine Verdrillung in v-Richtung angewendet, so daß 
sich der Zylinderradius zu 


r = vu? + w? + 2sin(20a + v/150) 


berechnet. Die verwendeten Konstanten sind experimentell bestimmt. Um die 
abwechselnd dunklen und hellen Jahresringe nachzubilden, wird eine Modulo- 
Operation auf den so errechneten Radius angewendet. 


Zur Nachbildung einer Marmorstruktur verwendet man eine Störungs- oder 
Rauschfunktion noise, die zu einem Punkt des dreidimensionalen Raumes einen 
Rauschwert zurückliefert, vgl. [Per85], [Wat89]. Zur Berechnung des Rausch- 
wertes verwendet man einen Integerverband, der aus allen Punkten des dreidi- 
mensionalen Raumes besteht, deren Koordinaten ganzzahlig sind. Für jeden 
Punkt des Integerverbandes wird ein Zufallswert berechnet, dessen Wert in ei- 
nem dreidimensionalen Feld abgelegt wird. Für Raumpunkte, die nicht dem 
Integerverband angehören, errechnet man den zugehörigen Zufallswert durch 
Interpolation aus den angrenzenden Werten des Integerverbandes. Dabei inter- 
poliert man zuerst in r-Richtung (entlang der Kanten des Verbandes), dann in 
y-Richtung (auf den Oberflächen der Volumenelemente des Verbandes), dann 
in z-Richtung, vgl. Abbildung 10.5. Als Interpolation kann unter anderem eine 


402 KAPITEL 10. SCHATTEN UND OBERFLÄCHENSTRUKTUREN 


struct RGB wood (u,v,w) 
float u,v,w; 

{ 

float r, alpha; 

int grain; 


r = sart(u*u + ww); 
if (w==0 && u>0) alpha = 0; 


else if (w==0 && u<0) alpha = 4*arctan(1); 
else alpha = arctan(u/w); 
r=r + 2*sin(20*alpha + v/150); 
grain = round(r) 4 60; 
if (grain < 40) 

return build RGB(r light,g_light,b_light); 
else return build RGB(r dark,g_dark,b_dark); 





Abbildung 10.3: Programmskizze zur Erzeugung einer Holzstruktur. RGB sei 
eine Datenstruktur, die einen Intensitätswert für jede der drei Grundfarben enthält. 
(rlight,glight,b_light) seien die zur Erzeugung einer hellen Holzstruktur, 
(r_dark,g_dark,b_dark) seien die zur Erzeugung einer dunklen Holzstruktur notwendi- 
gen Intensitätswerte. 





Abbildung 10.4: Nachbildung einer Holzstruktur. Rechts sind die Jahresringe wieder- 
gegeben. 
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Abbildung 10.5: Veranschaulichung 
des Interpolationsprozesses innerhalb 
des Integerverbandes. 





lineare oder kubische Interpolation verwendet werden. Der Grund für die Ver- 
wendung des Integerverbandes liegt darin, daß man zwar zufällige Störungen 
nachbilden will, diese sollen aber glatt sein, damit dicht benachbarte Raum- 
punkte ähnliche Störungswerte haben. Dies ist durch das beschriebene Vorgehen 
sichergestellt. 


Eine Marmorstruktur läßt sich durch das Verwirbeln von sich zyklisch wieder- 
holenden Bandstrukturen verschiedener Farbe modellieren, die beispielsweise 
durch Sinusfunktionen beschrieben werden können. Das Verwirbeln der Band- 
strukturen wird durch Überlagerung der oben beschriebenen noise-Funktion 
erreicht. Zusätzlich kann die Farbdarstellung der einzelnen Bänder ebenfalls 
durch die noise-Funktion gestört werden, so daß keine einheitliche Farbge- 
bung innerhalb der Bänder mehr existiert. Abbildung 10.6 zeigt eine mögliche 
Implementierung, vgl. [Wat89]. In [Wat89] sind auch Implementierungsdetails 
zur oben beschriebenen noise-Funktion beschrieben. Mit der Rauschfunktion 
lassen sich auch andere Naturphänomene wie Feuer, Wasser und Wolken nach- 


bilden, vgl. [Per85]. 


10.2.2 Zweidimensionale Strukturierungstechniken 


Die in diesem Abschnitt vorgestellte zweidimensionale Strukturierungstechnik 
verwendet einen zweidimensionalen Strukturraum, der auf die Oberflächen 
der darzustellenden Objekte abgebildet wird. Zur Verwendung beim Ray- 
Tracing-Verfahren muß die Abbildung umkehrbar sein, damit man zu einem 
Oberflächenpunkt, der sich aus der Schnittpunktberechnung zwischen Strahl 
und Objekt ergibt, den zugehörigen Punkt im Strukturraum findet. Wir wer- 
den im folgenden diese Abbildung für den Fall beschreiben, daß die Oberflächen 
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struct RGB marble (u,v,w) 
float u,v,w; 


{ 


float width=0.02, d,dd,intensity; 


d = (sin(u)+1000)*250*width + 7*noise(u/100,v/200,w/200); 
dd = ((int) d) % 17; 
if (dd < 4) 
intensity = 0.7 + 0.2*noise(u/70,v/50,w/50); 
else if ((dd < 9) || (dd > 12)) { 
d = abs(d - trunc(d/17)*17 - 10.5)*0.1538462; 
intensity = 0.4 + 0.3*d + 0.2*noise(u/100,v/100,w/100); 
} 
else intensity = 0.2 + 0.2*noise(u/100,v/100,w/100); 
return (build RGB(0.9*intensity,0.8*intensity,0.6*intensity); 


} 





Abbildung 10.6: Programmskizze zur Erzeugung einer Marmorstruktur nach [Wat89]. 
Zur Modellierung wird eine sich zyklisch wiederholende Bandstruktur benutzt, deren Breite 
durch width angegeben ist. Jedes Band besteht aus vier Unterbändern der Farben 
schwarz, grau, weiß und grau in dieser Reihenfolge. In d wird die Lage der des be- 
trachteten Punktes (u,v,w) bzgl. der Unterbänder berechnet. dd definiert die relative 
Lage der Unterbänder: [0:3] ist schwarz, [4:8] und [12:16] sind grau, [9:11] ist weiß. 
Die Werte der Konstanten sind empirisch bestimmt. Die Bandstruktur wird umso mehr 
verwirbelt, je mehr die Rauschfunktion noise bei der Berechnung von d gewichtet wird. 
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u (u=1,v=0) Fi (u=1,v=1) 
ä 4 
d 
v 
(u=0,v=0) b (u=0,v=1) 


Abbildung 10.7: Definition des zweidimensionalen Strukturraumes und des viereckigen 
Polygons. Punkte in dem mit x gekennzeichneten Bereich können durch u + vb mit 
0 < u,v < 1 nicht erreicht werden. 


der Objekte durch ebene, viereckige Polygone beschrieben werden, vgl. [BG89]. 
Wir nehmen an, daß die abzubildende Struktur im Bereich [0 : 1,0 : 1] des 
(u, v)-Strukturraumes definiert ist, vgl. Abbildung 10.7. 


Gesucht ist der zum Punkt (u,v) des Strukturraumes gehörende Punkt des 
viereckigen Polygons. Wenn a, b, c, und d wie in Abbildung 10.7 definiert sind, 
erreicht man durch ua + vb mit O < u,v < 1 nur den Bereich des von @ und b 
aufgespannten Parallelogramms. Das gesamte Polygon kann dadurch abgedeckt 
werden, daß man statt @ einen Vektor € verwendet, der die gewichtete Summe 
von @ und d ist. 


e=(l1-v)ä+tud 


Den zum Punkt (u,v) des Strukturraumes gehörende Punkt P des viereckigen 
Polygons erhält man dann durch 


pP = uec+ vb 
= ulll-v)ätud)+ovb 
= w(d-ä)+ud+ub (10.2) 


Wie bereits erwähnt, braucht man beim Einsatz im Ray-Tracing-Verfahren 
zu einem Punkt des viereckigen Polygons den zugehörigen Strukturwert (u, v). 
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Diesen kann man aus der Vektorgleichung (10.2) bestimmen, indem man eine 
Komponente nach u bzw. v auflöst und in eine der anderen Komponenten ein- 
setzt. Die dritte Komponente ist redundant. Wegen des auftretenden Term 
uv ergibt sich eine Gleichung zweiten Grades, zu deren Lösung eine üblicher- 
weise recht rechenzeitaufwendige Wurzeloperation durchzuführen ist. Da diese 
Umkehroperation beim Einsatz im Ray-Tracing-Verfahren für jeden gefunde- 
nen Schnittpunkt durchzuführen ist, versucht man die Kosten für die Operation 
zu minimieren. Dazu eliminiert man den Term uv aus (10.2), indem man das 
Kreuzprodukt zwischen (10.2) und d- ä= &- 5 bildet. Es ergibt sich: 


oder ausgerechnet: 


b.(cz — bz) — bz(c, — b,) a,(Cz — bz) — a,(c, - b,) 
bz(cy — by) — by(cz —'bz) G2(Cy — by) — aylcz — bz) 


A, B; 
v| A, |+ul B, 
A, B; 


P, Py(cz — bz) — Pz(cy - by) 
P, = Pz(Cz u b,) = Pz(C; —- b,) 
Pz(Cy — by) — Pylcz — b,) 


by(cz — bz) — bz(cy — by) | ay(cz — 52) — az(cy — by) 
® +u 


PN 

aoB. Pe 

N 
Il 


Dabei ist 


von dem auf dem Polygon liegenden Schnittpunkt abhängig. (A,, A,, A,) und 
(B., B,, B:) sind unabhängig von diesem Schnittpunkt und können vorberech- 
net werden. Aus der z&-Komponente ergibt sich: 


P, —- vA:r 
B: 


Einsetzen in die y„-Komponente liefert für v: 


_ PB. -P;B, 
" A,B.—A,B, 


® 


| 


[4 
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Man beachte, daß der Nenner dieser Gleichung unabhängig von p ist und vor- 
berechnet werden kann. Für u ergibt sich daraus: 


= Pr(AuBz — AuBy) — P,AsBz + PrAzB, 
” B.(A,B. — A.B,) 


Auch hier kann der Nenner vorberechnet werden. 


10.2.3 Unebenheiten der Oberflächen 


Durch Anwendung der bisher beschriebenen Verfahren können die Oberflächen 
der Objekte zwar mit einem geeigneten Muster dargestellt werden, erscheinen 
aber ansonsten anders als die in der Realität beobachtbaren Oberflächen voll- 
kommen eben. Ein Ansatz, dieses unrealistische Ebenmaß zu beseitigen, beruht 
auf der Beobachtung, daß Unebenheiten einer Oberfläche vor allem deshalb 
wahrgenommen werden, weil das einfallende Licht von den unebenen Stellen 
anders reflektiert wird als vom Rest der Oberfläche, vgl. [Bli78], [Wat89], 
[FvDFH90]. Der Unterschied zwischen realer und errechneter Posititon der 
Oberfläche spielt dagegen für die Darstellung keine Rolle. Aus diesem Grund 
braucht man für die Darstellung die Oberfläche auch nicht zu deformieren. 
Stattdessen reicht es aus, bei der Berechnung der Farbwerte den Normalen- 
vektor entsprechend zu ändern. Dadurch wird das Licht so reflektiert, als ob 
die Oberfläche deformiert sei, ohne daß dies im Modell der Fall zu sein braucht. 


Wenn Ölu, v) eine parametrisierte Funktion ist, die die Oberfläche beschreibt, 
ist 


0 0 
N(u,v) = 7, v) x 7, Wv) 


der Normalenvektor an einem gegebenen Punkt der Oberfläche, der durch den 
Parameterwert (u,v) beschrieben wird. Die Störung des so errechneten Norma- 
lenvektors erzielt man durch Verwendung einer Strukturfunktion T(u,v), die 
beispielsweise eine Wellenform beschreiben kann, vgl. Abbildung 10.8. Durch 


N(wo) 
IN(u,v)| 





Ö'(u,v) = Ö(u,v) + T(u,v) 


verschiebt man jeden Punkt der Originaloberfläche um einen kleinen, von 
T(u,v) festgelegten Betrag in Richtung des Normalenvektors. Den Norma- 
lenvektor der so veränderten Oberfläche errechnet man wieder durch Bilden des 
Kreuzproduktes: 
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i \ Pi T(u) 
N 1 


O(u) 


Abbildung 10.8: Veranschaulichung 

des Verfahrens im zweidimensionalen: 

man erhält die neue Oberfläche Ö’(u), 

indem man der Originaloberfläche 
>, Ö(u) die wellenförmige Störfunktion 
O'(u) T(u) überlagert. 


wobei 





86" _ 80 ,8TN md N 
du du du |N| du \IN| 
00 _ 00a [N 
dv dv  ÖuiN]| dv \ IN] 





Da die durch T' beschriebenen Verschiebungen üblicherweise recht klein sind, 
kann man in beiden Ausdrücken den letzten Summanden vernachlässigen. Man 
beachte, daß die Summanden, die ÖT/Ou bzw. OT/Ov beinhalten, nicht ver- 
nachlässigt werden können, weil die Änderung von T trotzdem groß sein kann. 
Für den Normalenvektor der veränderten Oberfläche ergibt sich damit: 


Nun) 20,99 ,9TN „20,20, oT N OTN OTN 
du Mm Öu|N| dv u viN| du|N| dvıN] 
Für den letzten Term gilt: 

or N „öTN _ÖTOTNxN_ 

Ou|N| ln] du In 
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und damit: 
N'(uv) = N+D 
mit 


OT N x8Ö/dv OT N x dÖ/du 


D = ET En) 
u IN] IV IN] 


409 


(10.3) 


Das genaue Aussehen der Unebenheiten auf der Oberfläche kann man mit 
der Störfunktion T(u,v) bestimmen. Eine mögliche Funktion ist T(u,v) = 
1/10sin(u)sin(v).Der nach Gleichung (10.3) errechnete Normalenvektor wird 
zur Bestimmung des darzustellenden Farbwertes unter Verwendung eines der in 
Kapitel 5 beschriebenen Reflexionsmodelle herangezogen. Beim Ray-Tracing- 
Verfahren wird der gestörte Normalenvektor sowohl für die Berechnung der 
lokalen Farbwerte als auch zur Berechnung des reflektierten und des transmit- 


tierten Strahles verwendet. 


Anhang: Zeitvergleich 
verschiedener Rechner 


Wir haben an vielen Stellen dieser Buches Algorithmen dadurch miteinan- 
der verglichen, daß wir die Anzahl der pro Schritt durchzuführenden Integer- 
oder Floating-Point-Operationen gegenübergestellt haben. Dies allein reicht 
in vielen Fällen nicht für einen genauen Vergleich aus, weil man nicht weiß, 
wieviele Maschinenzyklen welche Operation auf dem zur Verfügung stehenden 
Rechner braucht. So ist es beispielsweise nicht sinnvoll, eine Floating-Point- 
Operationen durch eine Integer-Operation zu ersetzen, wenn diese nicht schnel- 
ler ausgeführt werden kann. Für Prozessoren ohne Floating-Point-Üoprozessor 
werden Integer-Operationen zwar immer schneller auszuführen sein als die 
vergleichbaren Floating-Point-Operationen, weil diese durch Unterprogramme 
emuliert werden müssen. Für Prozessoren mit Floating-Point-Ooprozessor 
brauchen aber Floating-Point-Operationen oft nicht viel mehr Maschinenzy- 
klen als die entsprechenden Integer-Operationen, so daß eine Ersetzung kaum 
oder gar nicht lohnt. Für manche RISC-Rechner kann sogar der Fall auftre- 
ten, daß eine Integer-Multiplikation um ein Vielfaches mehr Zeit braucht als 
eine Floating-Point-Multiplikation, vgl. Tabellen 10.3 und 10.6. In diesem Fall 
führt eine Ersetzung sogar zu einem langsameren Programm. 


Wegen der großen Unterschiede der Ausführungszeit der verschiedenen Opera- 
tionen wollen wir in diesem Anhang dem Leser und Programmierer eine kurze 
Übersicht geben, was welche Operation auf welchem Rechner bzw. Prozessor 
kostet. Dazu haben wir die Zeiten der verschiedenen Operationen auf eini- 
gen der gängigen Rechner gemessen. Damit ist ein genauer Vergleich der im 
Text beschriebenen Algorithmen zumindest für diese Rechner möglich. Leider 
können wir die Tests nur für einige wenige Rechner angeben. Für nicht gete- 
stete Rechner können die Zeitmessungen teilweise übertragen werden, wenn sie 
den gleichen Prozessor wie einer der getesteten Rechner haben. Dies ist leider 
aber nicht immer möglich, weil auch das verwendete Betriebssystem und der 
Compiler eine Rolle spielen. Der Einfluß der Systemsoftware ist besonders groß 
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OT Mio [add | mul] div [round [inttoNoat [sart | sin] cos] tan 













int | 3.2 | 1 1 2.9 
float | 5.1 9 | 32.4 45.3 | 76.2 | 79.3 | 75.0 
double | 6.2 3 | 32.4 43.2 | 72.3 | 77.5 | 71.7 





Tabelle 10.1: Zeitmessung in Sekunden für einen 80386-PC mit einem 80387- 
Coprozessor unter DOS 5.0 mit 8 MByte Hauptspeicher. Beide Prozessoren sind von 
Intel und sind mit 33 MHz getaktet. Das Testprogramm wurde mit dem MSC-6.0- 
Compiler von Microsoft übersetzt. 


für Befehle, die durch Software emuliert werden müssen, wie dies für Floating- 
Point-Division oder Integer-Division oft der Fall ist, vgl. Tabellen 10.3 und 
10.5. Für diese Befehle kann die Ausführungszeit für verschiedene Rechner sehr 
unterschiedlich sein, selbst wenn sie mit dem gleichen Prozessor arbeiten. 


Die im folgenden angegebenen Tabellen enthalten die Zeiten in Sekunden, die für 
die Ausführung einer Million der angegebenen Operationen auf den getesteten 
Rechnern gebraucht werden. 


10.3 Prozessoren mit CISC-Architektur 


Prozessoren mit CISC-Architektur (complex instruction set computer) haben 
üblicherweise recht komplexe Befehlssätze mit vielen Adressierungsarten und 
Spezialbefehlen, vgl. [dB90], [HP90] und [WM92]. Das Ausführen eines Be- 
fehls braucht je nach seiner Komplexität unterschiedlich viele Maschinenzyklen. 
Viele der komplexen Befehle sind durch Mikroprogramme realisiert. Prozesso- 
ren mit CISC-Architektur sind seit dem Aufkommen der RISC-Architekturen auf 
dem Rückzug. Die wichtigsten Vertreter mit CISC-Architektur sind die Intel- 
Prozessoren 80286, 80386 und 80486, vgl. [Int86], die in allen PC’s verwendet 
werden, und die Motorola-Prozessoren 68020, 68030 und 68040, vgl. [Mot90], 
die z.B. für die Macintosh-Reihe von Apple verwendet werden. Wir geben hier 
die Zeiten für einen 80386-PC mit Coprozessor (80387) und für einen 80486-PC 
wieder, vgl. Tabellen 10.1 und 10.2. 


10.4 Prozessoren mit RISC-Architektur 


Prozessoren mit RISC-Architektur haben üblicherweise recht einfache Be- 
fehlssätze mit wenigen Adressierungsarten. Oft arbeiten die Befehle nur auf Re- 
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Mio [add [mul 
int | 0.2 | 2.2| 2.6 2.2 

2.6 | 2.6 | 22.0 3.7 8.1 [11.2 | 12.0 | 135.7 

2.6| 26 | 3.6 3.8 5.2| 84| 92| 10.2 


float 

double 
Tabelle 10.2: Zeitmessung in Sekunden für einen 80486-PC unter DOS 5.0 mit 8 
MByte Hauptspeicher. Der Prozessor ist von Intel und ist mit 66 MHz getaktet. Das 
Testprogramm wurde mit dem MSC-6.0-Compiler von Microsoft übersetzt. 


















gistern und der Hauptspeicherzugriff ıst nur über einfache Lade- und Speicher- 
Befehle möglich. Die Ausführung eines Befehls braucht unabhängig von der 
durchgeführten Operation meistens einen Maschinenzyklus. Während in CISC- 
Architekturen ein großer Teil der Chipfläche für die mikroprogrammierte Kon- 
trollogik zur Steuerung der komplexen Maschinenbefehle verbraucht wird, kom- 
men die RISC-Architekturen ın Ermangelung der komplexen Maschinenbe- 
fehle mit wesentlich einfacheren Kontrollogiken aus. Die dadurch eingesparte 
Chipfläche wird üblicherweise zur Erhöhung der Registerzahl, zur Implementie- 
rung von Instruktions- und Datencaches und für Lade- oder Speicher-Pipelines 
benutzt. Dies resultiert in einer vergleichsweise schnellen Ausführung der Ma- 
schinenbefehle, während bei CISC-Architekturen der Aufwand für die komplexen 
Befehle zu Lasten der häufiger ausgeführten einfachen Befehle geht. Damit gel- 
ten die RISC-Architekturen für viele Anwendungen den CISC-Architekturen als 
überlegen. 


Die wichtigsten Vertreter der RISC-Architektur sind die SPARC- und SupersPARC- 
Prozessoren, vgl. [Int92] und [Tex91], die MIPS-Prozessoren R3000, R4000 
und R6000, die Intel-Prozessoren i860, ı960 und Pentium, vgl. |Int90] und 
[WWW93], der Am29000 von AMD und der 88000 von Motorola. Wir ge- 
ben hier die Zeiten an für eine SPARCstation2 und eine SPARCstationl0 von 
Sun, einem SPARCRechner von Solbourne, eine Iris Indigo und eine Iris Grim- 
son von Silicon Graphics mit einem R3000 bzw. R4000-Prozessor, vgl. Tabellen 
10.3, 10.4, 10.5, 10.6 und 10.7. 


Für die Rechner mit SPARC-Prozessoren fällt auf, daß eine Integer-Multiplikation 
immer mehr Zeit braucht als eine Floating-Point-Multiplikation. Dies liegt 
daran, daß die SPARC-Prozessoren zwar einen in Hardware implementierten 
Maschinenbefehl für die Floating-Point-Multiplikation zur Verfügung stellen, 
nicht aber für die Integer-Multiplikation. Die Unterschiede in den Ausführungs- 
zeiten sind abhängig vom verwendeten Rechner und dessen Betriebssystem sehr 
groß, siehe Tabellen 10.3 und 10.5. Die SPARC-Prozessoren besitzen weder für 
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1 Mio 

int 10.23 | 17.55 | 42.02 0.26 
float |0.63 | 0.63 | 1.36 | 1.72 8.23 | 3.20 | 4.55 | 7.28 
double | 0.42 | 0.42 | 1.13 | 1.30 1.25 | 2.73 | 4.04 | 2.13 





Tabelle 10.3: Zeitmessung in Sekunden für eine SPARCstation? von Sun unter SunOS 
4.1.2 mit 32 MByte Hauptspeicher. Der Rechner hat einen mit 40 MHz getakteten 
SPARC-Prozessor. 


int | 0.08 | 1.31 | 3.05 0.12 
float | 0.33 | 0.33 | 0.48 1.00 3.26 | 1.75 | 2.25 | 3.73 
double | 0.13 | 0.13 | 0.33 1.30 0.60 | 1.56 | 2.10 | 1.02 


Tabelle 10.4: Zeitmessung in Sekunden für eine sparcstation10 (Modell 30) von Sun 
unter SunOS 4.1.3 mit 32 MByte Hauptspeicher. Der Rechner hat einen mit 40 MHz 
getakteten SuperSPARC-Prozessor. 









Mio [add mul] div [round [int-to-Aoak | sort | sin | cos] tan’ 
int | 0.23 | 1.75 | 4.15 0.35 

float | 0.63 | 0.68 | 72.95 1.66 8.66 | 3.45 | 4.87 | 7.93 

Rah 0.40 | 1.26 Er 1.25 | 3.00 | 4.45 | 1.87 


Tabelle 10.5: Zeitmessung in Sekunden für eine Solbourne 5E/504 unter OS/MP41A1 
(entspricht SunOS 4.1.1) mit 128 MByte Hauptspeicher. Der Rechner hat vier mit 40 
MHz getakteten SPARC-Prozessoren. 





I Mio [add | mul] div [round Tint.to Font Ian 
int !0.16 | 0.50 | 1.04 0.08 

float | 0.16 | 0.16 | 48.32 | 0.83 

double | 0.21 | 0.23 | 0.66 0.86 


Tabelle 10.6: Zeitmessung in Sekunden für eine Iris Indigo von Silicon Graphics unter 
Irix 4.05F mit 48 MByte Hauptspeicher. Der Rechner hat einen mit 33 MHz getakteten 
R3000-Prozessor von MIPS. 






















3.72 | 2.81 
3.73 | 2.77 
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div | int to_float tan 





rn 10 0.08 
2.63 | 1.61 | 2.09 | 1.39 
2.23 | 2.23 | 2.00 | 1.26 


Tabelle 10.7: Zeitmessung in Sekunden für eine Iris Grimson von Silicon Graphics unter 
Irix 4.05F mit 80 MByte Hauptspeicher. Der Rechner hat einen mit 50 MHz getakteten 
R4000-Prozessor von MIPS. 


die Integer-Division noch für die Floating-Point-Division einen in Hardware 
implementierten Maschinenbefehl. Die Ausführungszeiten für diese Rechner 
schwankt von Rechner zu Rechner ebenfalls erheblich, vgl. Tabellen 10.3 und 
10.5. Die Schwankungen für die ebenfalls in Software realisierten trigonome- 
trischen Funktionen und für die Wurzelfunktion sind dagegen nicht so aus- 
geprägt. Die SupersPARC-Prozessoren besitzen Maschinenbefehle für Integer- 
Multiplikation und -Division, die in Hardware implementiert sind, indem Teile 
der Floating-Point-Einheit mitbenutzt werden. Die Existenz dieser Befehle 
schlägt sich aber nicht in den Ausführungszeiten nieder, weil der verwendete 
Compiler diese Befehle nicht nutzt. 


Für die getesteten Rechner lassen sich die folgenden Aussagen treffen: 
oe Außer für die Iris Grimson lohnt es sich immer, eine Floating-Point- 
Addition durch eine Integer-Addition zu ersetzen. 


Für Rechner mit Floating-Point-Coprozessor lohnt sich die Ersetzung ei- 
ner Floating-Point-Multiplikation durch eine Integer-Multiplikation nie. 


e Eine Division ist für die meisten Rechner eine teure Operation, die 
möglichst vermieden werden sollte. Wenn der Divisor eine Konstante 
ist und die Division mehrmals ausgeführt wird, kann die billigere Mul- 
tiplikation mit dem Kehrwert verwendet werden. Für viele Rechner ist 
die Anwendung der Division auf double-Werte wesentlich billiger als die 
Division von float-Werten. 


Auf allen getesteten Rechnern sind die Zeiten für long-Integerwerte iden- 
tisch mit den Zeiten für normale Integerwerte, weil der Compiler beide als 


32-Bit-Werte darstellt. Die Zeiten sind deshalb nicht aufgeführt. 


Die Berechnungszeiten für double-Floating-Point-Werte sind meistens 
nicht höher als für einfache Floating-Point-Werte. Für Rechner, die in- 
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tern mit 64-Bit-Floating-Point-Werten rechnen, sind die Berechnungs- 
zeiten für double-Werte sogar oft niedriger, weil für einfache Floating- 
Point-Werte zusätzliche Umformungen durchgeführt werden müssen. 
Dies gilt insbesondere für die Division und die Wurzeloperation. Aus 
diesem Grund ist es sinnvoll, in einer Implementierung Floating-Point- 
Werte als double zu deklarieren, wenn der erhöhte Speicherplatzbedarf 
(64 statt 32 Bit pro Wert) in Kauf genommen werden kann. 


e Viele der heutigen Prozessoren verwenden Datencaches. Die Effekte die- 
ser Caches auf die Laufzeit der Operationen und Programme lassen sich 
schlecht vorhersagen. 


e Durch die Spezifikation von Registervariablen lassen sich oft beträchtliche 
Laufzeitgewinne erzielen, weil Lade- und Speicher-Operationen entfallen 
können. 


Die Optimierungen der inkrementellen Algorithmen wie z.B. des Bresenham- 
Algorithmus aus Abschnitt 2.1.2 lohnen sich für die meisten Rechner, weil 
nach der Optimierung nur Integer-Additionen verwendet werden. Dies 
sind auf den meisten Rechnern die billigsten Operationen. 
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